Skip to main content

Sinh video (Bước 1/3): Bắt đầu tác vụ

Thông tin

Chi tiết về quy trình tạo video với Veo, xem tại tài liệu chính thức của Google

Cảnh báo

Để phù hợp với cuộc thi, giá của các mô hình Veo đã được điều chỉnh so với giá gốc. Giá hiện tại: $0.5 / request.

POST /gemini/v1beta/models/{model}:predictLongRunning

Gửi một yêu cầu chứa mô tả (prompt) để bắt đầu quá trình tạo video. API sẽ trả về một operation_name để bạn theo dõi trong các bước tiếp theo.

Quan trọng

Do máy chủ proxy đang sử dụng cơ chế pass-through tới Google AI Studio, bạn sẽ sử dụng header x-goog-api-key thay cho header Authorization tiêu chuẩn.

Tham số đường dẫn (Path Parameters)

modelstringRequired

Mô hình sẽ sử dụng để tạo video. Hiện tại hỗ trợ:

  • veo-3.0-generate-001
  • veo-3.0-fast-generate-001
  • veo-2.0-generate-001

và các mô hình theo tài liệu của Google Gemini.

Cấu trúc yêu cầu (Request Body)

instancesarrayRequired

Một danh sách các đối tượng instance. Hiện tại, chỉ hỗ trợ một instance mỗi yêu cầu.

promptstringRequired

Mô tả chi tiết về video cần tạo.

imageobject

Một hình ảnh ban đầu để tạo hiệu ứng hoạt hình.

bytesBase64Encodedstring

Dữ liệu hình ảnh ban đầu được mã hóa base64.

mimeTypestring

Loại MIME của dữ liệu hình ảnh ban đầu. Ví dụ: image/png, image/jpeg.

parametersobject

Các tham số bổ sung để kiểm soát quá trình tạo video.

negativePromptstring

Mô tả những gì không nên có trong video.

aspectRatiostring

Tỷ lệ khung hình của video.

  • Tất cả các model: "16:9" (mặc định), "9:16" (chỉ 720p).
durationSecondsnumber

Thời gian của video (tính bằng giây), từ 5-8. Chỉ hỗ trợ cho Veo 2. Mặc định là 8 giây.

sampleCountnumber

Số lượng mẫu video cần tạo. Chỉ hỗ trợ cho Veo 2. Mặc định là 1, tối đa là 2.

resolutionstring

Độ phân giải của video.

  • Veo 3: "720p" (mặc định), "1080p" (chỉ cho 16:9).
  • Veo 2: Không hỗ trợ.
personGenerationstring

Kiểm soát việc tạo ra hình ảnh con người.

  • Veo 3:
    • Text-to-video: Chỉ hỗ trợ "allow_all".
    • Image-to-video: Chỉ hỗ trợ "allow_adult".
  • Veo 2:
    • Text-to-video: Hỗ trợ "allow_all", "allow_adult", "dont_allow".
    • Image-to-video: Hỗ trợ "allow_adult""dont_allow".

Cấu trúc Phản hồi (Response Body)

namestring

Tên của tác vụ (operation) đang chạy. Giá trị này được sử dụng để kiểm tra trạng thái ở Bước 2. Ví dụ: models/veo-3.0-generate-001/operations/idrk08ltkg0a.

curl -X POST "https://api.thucchien.ai/gemini/v1beta/models/:predictLongRunning" \
-H "Content-Type: application/json" \
-H "x-goog-api-key: " \
-d '{
"instances": [{
"prompt": "",
"image": null
}],
"parameters": {
"negativePrompt": "",
"aspectRatio": "",
"resolution": "",
"personGeneration": ""
}
}'
Example Response
{
"name": "models/veo-3.0-generate-001/operations/idrk08ltkg0a"
}