Skip to main content

Chuyển văn bản thành giọng nói (Text-to-Speech)

Các mô hình Text-to-Speech (TTS) cho phép bạn chuyển đổi một đoạn văn bản thành file âm thanh có giọng nói tự nhiên.

Các model được hỗ trợ:

  • gemini-2.5-flash-preview-tts (Google Gemini)
  • gemini-2.5-pro-preview-tts (Google Gemini)

Endpoint: POST /audio/speech

Cách này cho phép bạn nhanh chóng tạo và lưu file âm thanh.

curl https://api.thucchien.ai/audio/speech \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <your_api_key>" \
-d '{
"model": "gemini-2.5-flash-preview-tts",
"input": "Xin chào, đây là một thử nghiệm chuyển văn bản thành giọng nói qua [AI Thực Chiến](https://thucchien.ai) gateway.",
"voice": "Zephyr"
}' \
--output speech_output.mp3

Kết quả bạn sẽ có file audio như sau:

Các tham số tùy chọn

Ngoài model, input, và voice, bạn có thể sử dụng thêm các tham số khác để tinh chỉnh giọng nói, tốc độ, và định dạng âm thanh đầu ra.

Để biết danh sách đầy đủ các tham số và cách sử dụng, vui lòng tham khảo tài liệu chính thức tại đây: Google Cloud Text-to-Speech Documentation

Ngoài ra, xem thêm nhiều lượt nói (multi-speaker) tại đây