Sinh video (Bước 1/3): Bắt đầu tác vụ
Chi tiết về quy trình tạo video với Veo, xem tại tài liệu chính thức của Google
Để phù hợp với cuộc thi, giá của các mô hình Veo đã được điều chỉnh so với giá gốc. Giá hiện tại: $0.5 / request.
POST /gemini/v1beta/models/{model}:predictLongRunning
Gửi một yêu cầu chứa mô tả (prompt) để bắt đầu quá trình tạo video. API sẽ trả về một operation_name để bạn theo dõi trong các bước tiếp theo.
Do máy chủ proxy đang sử dụng cơ chế pass-through tới Google AI Studio, bạn sẽ sử dụng header x-goog-api-key thay cho header Authorization tiêu chuẩn.
Tham số đường dẫn (Path Parameters)
modelstringRequiredMô hình sẽ sử dụng để tạo video. Hiện tại hỗ trợ:
- veo-3.0-generate-001
- veo-3.0-fast-generate-001
- veo-2.0-generate-001
và các mô hình theo tài liệu của Google Gemini.
Cấu trúc yêu cầu (Request Body)
instancesarrayRequiredMột danh sách các đối tượng instance. Hiện tại, chỉ hỗ trợ một instance mỗi yêu cầu.
promptstringRequiredMô tả chi tiết về video cần tạo.
imageobjectMột hình ảnh ban đầu để tạo hiệu ứng hoạt hình.
bytesBase64EncodedstringDữ liệu hình ảnh ban đầu được mã hóa base64.
mimeTypestringLoại MIME của dữ liệu hình ảnh ban đầu. Ví dụ: image/png, image/jpeg.
parametersobjectCác tham số bổ sung để kiểm soát quá trình tạo video.
negativePromptstringMô tả những gì không nên có trong video.
aspectRatiostringTỷ lệ khung hình của video.
- Tất cả các model: "16:9"(mặc định),"9:16"(chỉ 720p).
durationSecondsnumberThời gian của video (tính bằng giây), từ 5-8. Chỉ hỗ trợ cho Veo 2. Mặc định là 8 giây.
sampleCountnumberSố lượng mẫu video cần tạo. Chỉ hỗ trợ cho Veo 2. Mặc định là 1, tối đa là 2.
resolutionstringĐộ phân giải của video.
- Veo 3: "720p"(mặc định),"1080p"(chỉ cho 16:9).
- Veo 2: Không hỗ trợ.
personGenerationstringKiểm soát việc tạo ra hình ảnh con người.
- Veo 3:
- Text-to-video: Chỉ hỗ trợ "allow_all".
- Image-to-video: Chỉ hỗ trợ "allow_adult".
 
- Text-to-video: Chỉ hỗ trợ 
- Veo 2:
- Text-to-video: Hỗ trợ "allow_all","allow_adult","dont_allow".
- Image-to-video: Hỗ trợ "allow_adult"và"dont_allow".
 
- Text-to-video: Hỗ trợ 
Cấu trúc Phản hồi (Response Body)
namestringTên của tác vụ (operation) đang chạy. Giá trị này được sử dụng để kiểm tra trạng thái ở Bước 2. Ví dụ: models/veo-3.0-generate-001/operations/idrk08ltkg0a.
curl -X POST "https://api.thucchien.ai/gemini/v1beta/models/:predictLongRunning" \-H "Content-Type: application/json" \-H "x-goog-api-key: " \-d '{  "instances": [{    "prompt": "",    "image": null  }],  "parameters": {    "negativePrompt": "",    "aspectRatio": "",    "resolution": "",    "personGeneration": ""  }}'{
  "name": "models/veo-3.0-generate-001/operations/idrk08ltkg0a"
}