Chuyển văn bản thành giọng nói (Text-to-Speech)

POST `/audio/speech`

Chuyển đổi một đoạn văn bản thành file âm thanh có giọng nói tự nhiên.

Tham khảo

Chi tiết tham khảo tại tài liệu LiteLLM API

Phương pháp thay thế

Ngoài endpoint này, bạn cũng có thể sử dụng mô hình text-to-speech thông qua endpoint Google Gemini với multi-speaker prompts.

Cấu trúc yêu cầu (Request Body)

modelstringRequired

ID của mô hình text-to-speech sẽ sử dụng. Ví dụ: gemini-2.5-flash-preview-tts.

inputstringRequired

Đoạn văn bản cần chuyển đổi thành giọng nói.

voicestringRequired

Giọng nói sẽ sử dụng. Các tùy chọn bao gồm Zephyr, Puck, Charon, và nhiều hơn nữa. Xem danh sách đầy đủ trong ví dụ tương tác.

Cấu trúc Phản hồi (Response Body)

Phản hồi thành công sẽ trả về file âm thanh.

curl https://api.thucchien.ai/audio/speech \
-H "Content-Type: application/json" \
-H "Authorization: Bearer " \
-d '{
  "model": "",
  "input": "Xin chào, đây là một thử nghiệm chuyển văn bản thành giọng nói qua AI Thực Chiến gateway.",
  "voice": ""
}' \
--output generated_audio.mp3

Example Response
{
  "status": 200,
  "contentType": "audio/mpeg",
  "message": "Response body contains the audio file."
}

POST /audio/speech​

Cấu trúc yêu cầu (Request Body)​

Cấu trúc Phản hồi (Response Body)​

POST `/audio/speech`

Cấu trúc yêu cầu (Request Body)

Cấu trúc Phản hồi (Response Body)