Skip to main content

Chuyển văn bản thành giọng nói (Text-to-Speech)

POST /audio/speech

Chuyển đổi một đoạn văn bản thành file âm thanh có giọng nói tự nhiên.

Tham khảo

Chi tiết tham khảo tại tài liệu LiteLLM API

Phương pháp thay thế

Ngoài endpoint này, bạn cũng có thể sử dụng mô hình text-to-speech thông qua endpoint Google Gemini với multi-speaker prompts.

Cấu trúc yêu cầu (Request Body)

modelstringRequired

ID của mô hình text-to-speech sẽ sử dụng. Ví dụ: gemini-2.5-flash-preview-tts.

inputstringRequired

Đoạn văn bản cần chuyển đổi thành giọng nói.

voicestringRequired

Giọng nói sẽ sử dụng. Các tùy chọn bao gồm Zephyr, Puck, Charon, và nhiều hơn nữa. Xem danh sách đầy đủ trong ví dụ tương tác.


Cấu trúc Phản hồi (Response Body)

Phản hồi thành công sẽ trả về file âm thanh.

curl https://api.thucchien.ai/audio/speech \
-H "Content-Type: application/json" \
-H "Authorization: Bearer " \
-d '{
"model": "",
"input": "",
"voice": ""
}' \
--output generated_audio.mp3
Example Response
{
"status": 200,
"contentType": "audio/mpeg",
"message": "Response body contains the audio file."
}