Veo 3 พร้อมให้ใช้งานแล้วใน Gemini API ดูข้อมูลเพิ่มเติม

หน้านี้ได้รับการแปลโดย Cloud Translation API

สร้างวิดีโอด้วย Veo 3 ใน Gemini API

Veo 3 เป็นโมเดลที่ล้ำสมัยของ Google สำหรับการสร้างวิดีโอ 720p ความยาว 8 วินาทีที่มีความเที่ยงตรงสูงจากพรอมต์ข้อความ โดยมี ความสมจริงที่น่าทึ่งและเสียงที่สร้างขึ้นโดยตรง คุณเข้าถึงโมเดลนี้ได้แบบเป็นโปรแกรมโดยใช้ Gemini API Veo 3 ทำงานได้ดีใน สไตล์ภาพและภาพยนตร์ที่หลากหลาย ดูข้อมูลเพิ่มเติมเกี่ยวกับตัวแปรของโมเดล Veo ที่มีได้ในส่วนเวอร์ชันของโมเดล

เลือกตัวอย่างเพื่อดูวิธีสร้างวิดีโอที่มีบทสนทนา ความสมจริง แบบภาพยนตร์ หรือภาพเคลื่อนไหวที่สร้างสรรค์

การสร้างวิดีโอจากรูปภาพ

โค้ดต่อไปนี้แสดงการสร้างรูปภาพโดยใช้ Imagen จากนั้นใช้รูปภาพดังกล่าวเป็น เฟรมเริ่มต้นสำหรับการสร้างวิดีโอด้วย Veo 3

Python

import time from google import genai  client = genai.Client()  prompt = "Panning wide shot of a calico kitten sleeping in the sunshine"  # Step 1: Generate an image with Imagen. imagen = client.models.generate_images(     model="imagen-3.0-generate-002",     prompt=prompt, )  # Step 2: Generate video with Veo 3 using the image. operation = client.models.generate_videos(     model="veo-3.0-generate-preview",     prompt=prompt,     image=imagen.generated_images[0].image, )  # Poll the operation status until the video is ready. while not operation.done:     print("Waiting for video generation to complete...")     time.sleep(10)     operation = client.operations.get(operation)  # Download the video. video = operation.response.generated_videos[0] client.files.download(file=video.video) video.video.save("veo3_with_image_input.mp4") print("Generated video saved to veo3_with_image_input.mp4")

JavaScript

import { GoogleGenAI } from "@google/genai";  const ai = new GoogleGenAI({});  const prompt = "Panning wide shot of a calico kitten sleeping in the sunshine";  // Step 1: Generate an image with Imagen. const imagenResponse = await ai.models.generateImages({   model: "imagen-3.0-generate-002",   prompt: prompt, });  // Step 2: Generate video with Veo 3 using the image. let operation = await ai.models.generateVideos({   model: "veo-3.0-generate-preview",   prompt: prompt,   image: {     imageBytes: imagenResponse.generatedImages[0].image.imageBytes,     mimeType: "image/png",   }, });  // Poll the operation status until the video is ready. while (!operation.done) {   console.log("Waiting for video generation to complete...")   await new Promise((resolve) => setTimeout(resolve, 10000));   operation = await ai.operations.getVideosOperation({     operation: operation,   }); }  // Download the video. ai.files.download({     file: operation.response.generatedVideos[0].video,     downloadPath: "veo3_with_image_input.mp4", }); console.log(`Generated video saved to veo3_with_image_input.mp4`);

Go

package main  import (     "context"     "log"     "os"     "time"      "google.golang.org/genai" )  func main() {     ctx := context.Background()     client, err := genai.NewClient(ctx, nil)     if err != nil {         log.Fatal(err)     }      prompt := "Panning wide shot of a calico kitten sleeping in the sunshine"      // Step 1: Generate an image with Imagen.     imagenResponse, err := client.Models.GenerateImages(         ctx,         "imagen-3.0-generate-002",         prompt,         nil, // GenerateImagesConfig     )     if err != nil {         log.Fatal(err)     }      // Step 2: Generate video with Veo 3 using the image.     operation, err := client.Models.GenerateVideos(         ctx,         "veo-3.0-generate-preview",         prompt,         imagenResponse.GeneratedImages[0].Image,         nil, // GenerateVideosConfig     )     if err != nil {         log.Fatal(err)     }      // Poll the operation status until the video is ready.     for !operation.Done {         log.Println("Waiting for video generation to complete...")         time.Sleep(10 * time.Second)         operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)     }      // Download the video.     video := operation.Response.GeneratedVideos[0]     client.Files.Download(ctx, video.Video, nil)     fname := "veo3_with_image_input.mp4"     _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)     log.Printf("Generated video saved to %s\n", fname) }

พารามิเตอร์และข้อกำหนดของ Veo API

พารามิเตอร์เหล่านี้คือพารามิเตอร์ที่คุณตั้งค่าได้ในคำขอ API เพื่อควบคุมกระบวนการสร้างวิดีโอ

พารามิเตอร์	คำอธิบาย	Veo 3 และ Veo 3 Fast (เวอร์ชันตัวอย่าง)	Veo 2 (เสถียร)
`prompt`	คำอธิบายแบบข้อความสำหรับวิดีโอ รองรับการเตือนด้วยเสียง	`string`	`string`
`negativePrompt`	ข้อความอธิบายสิ่งที่ไม่ควรใส่ในวิดีโอ	`string`	`string`
`image`	รูปภาพเริ่มต้นที่จะทำเป็นภาพเคลื่อนไหว	วัตถุ `Image` รายการ	วัตถุ `Image` รายการ
`aspectRatio`	สัดส่วนภาพของวิดีโอ	`"16:9"`	`"16:9"`, `"9:16"`
`personGeneration`	ควบคุมการสร้างบุคคล (ดูข้อจำกัดด้านภูมิภาคได้ที่ข้อจำกัด)	เปลี่ยนข้อความเป็นวิดีโอ: `"allow_all"` เท่านั้น เปลี่ยนรูปภาพเป็นวิดีโอ: `"allow_adult"` เท่านั้น	ข้อความเป็นวิดีโอ: `"allow_all"`, `"allow_adult"`, `"dont_allow"` รูปภาพเป็นวิดีโอ: `"allow_adult"` และ `"dont_allow"`

คุณปรับแต่งการสร้างวิดีโอได้โดยการตั้งค่าพารามิเตอร์ในคำขอ เช่น คุณระบุ negativePrompt เพื่อเป็นแนวทางให้โมเดลได้

Python

import time from google import genai from google.genai import types  client = genai.Client()  operation = client.models.generate_videos(     model="veo-3.0-generate-preview",     prompt="A cinematic shot of a majestic lion in the savannah.",     config=types.GenerateVideosConfig(negative_prompt="cartoon, drawing, low quality"), )  # Poll the operation status until the video is ready. while not operation.done:     print("Waiting for video generation to complete...")     time.sleep(10)     operation = client.operations.get(operation)  # Download the generated video. generated_video = operation.response.generated_videos[0] client.files.download(file=generated_video.video) generated_video.video.save("parameters_example.mp4") print("Generated video saved to parameters_example.mp4")

JavaScript

import { GoogleGenAI } from "@google/genai";  const ai = new GoogleGenAI({});  let operation = await ai.models.generateVideos({   model: "veo-3.0-generate-preview",   prompt: "A cinematic shot of a majestic lion in the savannah.",   config: {     aspectRatio: "16:9",     negativePrompt: "cartoon, drawing, low quality"   }, });  // Poll the operation status until the video is ready. while (!operation.done) {   console.log("Waiting for video generation to complete...")   await new Promise((resolve) => setTimeout(resolve, 10000));   operation = await ai.operations.getVideosOperation({     operation: operation,   }); }  // Download the generated video. ai.files.download({     file: operation.response.generatedVideos[0].video,     downloadPath: "parameters_example.mp4", }); console.log(`Generated video saved to parameters_example.mp4`);

Go

package main  import (     "context"     "log"     "os"     "time"      "google.golang.org/genai" )  func main() {     ctx := context.Background()     client, err := genai.NewClient(ctx, nil)     if err != nil {         log.Fatal(err)     }      videoConfig := &genai.GenerateVideosConfig{         AspectRatio: "16:9",         NegativePrompt: "cartoon, drawing, low quality",     }      operation, _ := client.Models.GenerateVideos(         ctx,         "veo-3.0-generate-preview",         "A cinematic shot of a majestic lion in the savannah.",         nil,         videoConfig,     )      // Poll the operation status until the video is ready.     for !operation.Done {         log.Println("Waiting for video generation to complete...")         time.Sleep(10 * time.Second)         operation, _ = client.Operations.GetVideosOperation(ctx, operation, nil)     }      // Download the generated video.     video := operation.Response.GeneratedVideos[0]     client.Files.Download(ctx, video.Video, nil)     fname := "parameters_example.mp4"     _ = os.WriteFile(fname, video.Video.VideoBytes, 0644)     log.Printf("Generated video saved to %s\n", fname) }

REST

# Note: This script uses jq to parse the JSON response. # GEMINI API Base URL BASE_URL="https://generativelanguage.googleapis.com/v1beta"  # Send request to generate video and capture the operation name into a variable. operation_name=$(curl -s "${BASE_URL}/models/veo-3.0-generate-preview:predictLongRunning" \   -H "x-goog-api-key: $GEMINI_API_KEY" \   -H "Content-Type: application/json" \   -X "POST" \   -d '{     "instances": [{         "prompt": "A cinematic shot of a majestic lion in the savannah."       }     ],     "parameters": {       "aspectRatio": "16:9",       "negativePrompt": "cartoon, drawing, low quality"     }   }' | jq -r .name)  # Poll the operation status until the video is ready while true; do   # Get the full JSON status and store it in a variable.   status_response=$(curl -s -H "x-goog-api-key: $GEMINI_API_KEY" "${BASE_URL}/${operation_name}")    # Check the "done" field from the JSON stored in the variable.   is_done=$(echo "${status_response}" | jq .done)    if [ "${is_done}" = "true" ]; then     # Extract the download URI from the final response.     video_uri=$(echo "${status_response}" | jq -r '.response.generateVideoResponse.generatedSamples[0].video.uri')     echo "Downloading video from: ${video_uri}"      # Download the video using the URI and API key and follow redirects.     curl -L -o parameters_example.mp4 -H "x-goog-api-key: $GEMINI_API_KEY" "${video_uri}"     break   fi   # Wait for 5 seconds before checking again.   sleep 10 done

การจัดการการดำเนินการแบบไม่พร้อมกัน

การสร้างวิดีโอเป็นงานที่ต้องใช้การคำนวณอย่างเข้มข้น เมื่อคุณส่งคำขอ ไปยัง API ระบบจะเริ่มงานที่ใช้เวลานานและส่งออบเจ็กต์ operation กลับมาทันที จากนั้นคุณต้องทำการสำรวจจนกว่าวิดีโอจะพร้อม ซึ่งจะระบุโดยdone สถานะเป็นจริง

หัวใจสำคัญของกระบวนการนี้คือลูปการสำรวจ ซึ่งจะตรวจสอบสถานะของงานเป็นระยะๆ

Python

import time from google import genai from google.genai import types  client = genai.Client()  # After starting the job, you get an operation object. operation = client.models.generate_videos(     model="veo-3.0-generate-preview",     prompt="A cinematic shot of a majestic lion in the savannah.", )  # Alternatively, you can use operation.name to get the operation. operation = types.GenerateVideosOperation(name=operation.name)  # This loop checks the job status every 10 seconds. while not operation.done:     time.sleep(10)     # Refresh the operation object to get the latest status.     operation = client.operations.get(operation)  # Once done, the result is in operation.response. # ... process and download your video ...

JavaScript

import { GoogleGenAI } from "@google/genai";  const ai = new GoogleGenAI({});  // After starting the job, you get an operation object. let operation = await ai.models.generateVideos({   model: "veo-3.0-generate-preview",   prompt: "A cinematic shot of a majestic lion in the savannah.", });  // Alternatively, you can use operation.name to get the operation. // operation = types.GenerateVideosOperation(name=operation.name)  // This loop checks the job status every 10 seconds. while (!operation.done) {     await new Promise((resolve) => setTimeout(resolve, 1000));     // Refresh the operation object to get the latest status.     operation = await ai.operations.getVideosOperation({ operation }); }  // Once done, the result is in operation.response. // ... process and download your video ...

ฟีเจอร์ของโมเดล

ฟีเจอร์	คำอธิบาย	Veo 3 และ Veo 3 Fast (เวอร์ชันตัวอย่าง)	Veo 2 (เสถียร)
เสียง	สร้างเสียงพร้อมวิดีโอโดยตรง	✔️ เปิดตลอดเวลา	❌ ไร้เสียงเท่านั้น
รูปแบบอินพุต	ประเภทอินพุตที่ใช้สำหรับการสร้าง	เปลี่ยนข้อความเป็นวิดีโอ เปลี่ยนรูปภาพเป็นวิดีโอ	เปลี่ยนข้อความเป็นวิดีโอ เปลี่ยนรูปภาพเป็นวิดีโอ
วิธีแก้ปัญหา	ความละเอียดเอาต์พุตของวิดีโอ	720p	720p
อัตราเฟรม	อัตราเฟรมเอาต์พุตของวิดีโอ	24 เฟรมต่อวินาที	24 เฟรมต่อวินาที
ระยะเวลาของวิดีโอ	ความยาวของวิดีโอที่สร้างขึ้น	8 วินาที	5-8 วินาที
วิดีโอต่อคำขอ	จำนวนวิดีโอที่สร้างต่อคำขอ	1	1 หรือ 2
สถานะและรายละเอียด	ความพร้อมใช้งานของโมเดลและรายละเอียดเพิ่มเติม	ตัวอย่าง	เสถียร

ดูรายละเอียดการใช้งาน Veo เพิ่มเติมได้ที่ส่วนรุ่นของโมเดล รวมถึงหน้าราคาและโควต้า การใช้งาน

คู่มือการใช้พรอมต์สำหรับ Veo

ส่วนนี้มีตัวอย่างวิดีโอที่คุณสร้างได้โดยใช้ Veo และแสดงวิธีแก้ไขพรอมต์เพื่อสร้างผลลัพธ์ที่แตกต่างกัน

ตัวกรองความปลอดภัย

Veo ใช้ตัวกรองความปลอดภัยใน Gemini เพื่อช่วยให้มั่นใจว่าวิดีโอที่สร้างขึ้นและรูปภาพที่อัปโหลดจะไม่มีเนื้อหาที่ทำให้เกิดความไม่พอใจ ระบบจะบล็อกพรอมต์ที่ละเมิดข้อกำหนดและหลักเกณฑ์ของเรา

ข้อมูลเบื้องต้นเกี่ยวกับการเขียนพรอมต์

พรอมต์ที่ดีต้องสื่อความหมายและชัดเจน หากต้องการใช้ Veo ให้เกิดประโยชน์สูงสุด ให้เริ่มต้นด้วย การระบุไอเดียหลัก ปรับแต่งไอเดียโดยเพิ่มคีย์เวิร์ดและตัวแก้ไข และรวมคำศัพท์เฉพาะของวิดีโอลงในพรอมต์

พรอมต์ของคุณควรมีองค์ประกอบต่อไปนี้

เรื่อง: วัตถุ บุคคล สัตว์ หรือทิวทัศน์ที่คุณต้องการในวิดีโอ เช่น ทิวทัศน์เมือง ธรรมชาติ ยานพาหนะ หรือลูกสุนัข
การกระทำ: สิ่งที่วัตถุกำลังทำ (เช่น เดิน วิ่ง หรือหันศีรษะ)
สไตล์: ระบุแนวทางครีเอทีฟโฆษณาโดยใช้คีย์เวิร์ดสไตล์ภาพยนตร์ที่เฉพาะเจาะจง เช่น ไซไฟ ภาพยนตร์สยองขวัญ ฟิล์มนัวร์ หรือสไตล์ภาพเคลื่อนไหว เช่น การ์ตูน
การวางตำแหน่งและการเคลื่อนไหวของกล้อง: [ไม่บังคับ] ควบคุมตำแหน่ง และการเคลื่อนไหวของกล้องโดยใช้คำต่างๆ เช่น มุมมองจากด้านบน ระดับสายตา ภาพมุมสูง ภาพดอลลี่ หรือมุมมองจากด้านล่าง
องค์ประกอบ: [ไม่บังคับ] วิธีการจัดเฟรมภาพ เช่น ภาพกว้าง ภาพระยะใกล้ ภาพบุคคลเดี่ยว หรือภาพบุคคลคู่
โฟกัสและเอฟเฟกต์เลนส์: [ไม่บังคับ] ใช้คำต่างๆ เช่น โฟกัสตื้น โฟกัสลึก โฟกัสแบบนุ่ม เลนส์มาโคร และเลนส์มุมกว้างเพื่อให้ได้ เอฟเฟกต์ภาพที่ต้องการ
บรรยากาศ: [ไม่บังคับ] สีและแสงมีส่วนช่วยในฉากอย่างไร เช่น โทนสีน้ำเงิน กลางคืน หรือโทนสีอุ่น

เคล็ดลับเพิ่มเติมสำหรับการเขียนพรอมต์

ใช้ภาษาที่สื่อความหมาย: ใช้คำคุณศัพท์และคำกริยาวิเศษณ์เพื่อสร้างภาพที่ชัดเจน สำหรับ Veo
ปรับปรุงรายละเอียดใบหน้า: ระบุรายละเอียดใบหน้าเป็นจุดโฟกัสของรูปภาพ เช่น ใช้คำว่าภาพบุคคลในพรอมต์

ดูกลยุทธ์การแจ้งที่ครอบคลุมมากขึ้นได้ที่ข้อมูลเบื้องต้นเกี่ยวกับ การออกแบบพรอมต์

การป้อนพรอมต์สำหรับเสียง

Veo 3 ช่วยให้คุณระบุคิวสำหรับเอฟเฟกต์เสียง เสียงรอบข้าง และบทสนทนาได้ โมเดลจะจับภาพความแตกต่างของคิวเหล่านี้เพื่อสร้างซาวด์แทร็กที่ซิงค์กัน

บทสนทนา: ใช้เครื่องหมายคำพูดสำหรับคำพูดที่เฉพาะเจาะจง (เช่น "นี่ต้องเป็น กุญแจแน่ๆ" เขากระซิบ)
เอฟเฟกต์เสียง (SFX): อธิบายเสียงอย่างชัดเจน (ตัวอย่าง: ยาง กรีดร้องเสียงดัง เครื่องยนต์คำราม)
เสียงแวดล้อม: อธิบายภาพเสียงของสภาพแวดล้อม (ตัวอย่าง: เสียงฮัมเบาๆ ที่น่าขนลุกก้องกังวานอยู่เบื้องหลัง)

วิดีโอเหล่านี้แสดงการแจ้งให้ Veo 3 สร้างเสียงโดยเพิ่มระดับรายละเอียด มากขึ้น

พรอมต์	เอาต์พุตที่สร้างขึ้น
รายละเอียดเพิ่มเติม (บทสนทนาและบรรยากาศ) ภาพระยะใกล้ของคน 2 คนที่กำลังจ้องภาพวาดลึกลับบนผนัง โดยมีแสงไฟจากคบเพลิงส่องสว่าง "นี่ต้องเป็นกุญแจสำคัญ" เขากระซิบขณะลากนิ้วตามรูปแบบ "แต่ว่ามันหมายความว่ายังไงนะ" เธอกล่าวอย่างงุนงงพร้อมกับเอียงศีรษะ หินชื้น งานแกะสลักอันวิจิตร สัญลักษณ์ที่ซ่อนอยู่ เสียงฮัมเบาๆ ที่ชวนขนลุกก้องกังวานอยู่เบื้องหลัง
รายละเอียดน้อยลง (บทสนทนา) การตั้งแคมป์ (สต็อปโมชัน): นักตั้งแคมป์: "ตอนนี้ฉันเป็นหนึ่งเดียวกับธรรมชาติแล้ว!" หมี: "ธรรมชาติคงอยากมีพื้นที่ส่วนตัวบ้าง"

พรอมต์

เอาต์พุตที่สร้างขึ้น

รายละเอียดเพิ่มเติม (บทสนทนาและบรรยากาศ)
ภาพระยะใกล้ของคน 2 คนที่กำลังจ้องภาพวาดลึกลับบนผนัง โดยมีแสงไฟจากคบเพลิงส่องสว่าง "นี่ต้องเป็นกุญแจสำคัญ" เขากระซิบขณะลากนิ้วตามรูปแบบ "แต่ว่ามันหมายความว่ายังไงนะ" เธอกล่าวอย่างงุนงงพร้อมกับเอียงศีรษะ หินชื้น งานแกะสลักอันวิจิตร สัญลักษณ์ที่ซ่อนอยู่ เสียงฮัมเบาๆ ที่ชวนขนลุกก้องกังวานอยู่เบื้องหลัง

รายละเอียดน้อยลง (บทสนทนา)
การตั้งแคมป์ (สต็อปโมชัน): นักตั้งแคมป์: "ตอนนี้ฉันเป็นหนึ่งเดียวกับธรรมชาติแล้ว!" หมี: "ธรรมชาติคงอยากมีพื้นที่ส่วนตัวบ้าง"

ลองใช้พรอมต์เหล่านี้ด้วยตัวคุณเองเพื่อฟังเสียง ลองใช้ Veo 3

การใช้รูปภาพอ้างอิงเพื่อสร้างวิดีโอ

คุณสามารถทำให้วัตถุในชีวิตประจำวันเคลื่อนไหว สร้างภาพวาดและภาพเขียนให้มีชีวิตชีวา รวมถึงเพิ่ม การเคลื่อนไหวและเสียงให้กับฉากธรรมชาติได้โดยใช้ความสามารถเปลี่ยนรูปภาพเป็นวิดีโอของ Veo

พรอมต์	เอาต์พุตที่สร้างขึ้น
รูปภาพอินพุต (สร้างโดย Imagen) กระต่ายกับช็อกโกแลตแท่ง
วิดีโอเอาต์พุต (สร้างโดย Veo 3) กระต่ายวิ่งหนี

ตัวอย่างพรอมต์และเอาต์พุต

ส่วนนี้จะแสดงพรอมต์หลายรายการ โดยเน้นว่ารายละเอียดที่อธิบายได้จะช่วย ยกระดับผลลัพธ์ของวิดีโอแต่ละรายการได้อย่างไร

ตีระฆังเบา

วิดีโอนี้สาธิตวิธีใช้องค์ประกอบของพื้นฐานการเขียนพรอมต์ในพรอมต์

พรอมต์	เอาต์พุตที่สร้างขึ้น
ภาพระยะใกล้ (องค์ประกอบ) ของน้ำแข็งย้อยที่กำลังละลาย (วัตถุ) บนกำแพงหินที่แข็งตัว (บริบท) ที่มีโทนสีน้ำเงินเย็น (บรรยากาศ) ซึ่งซูมเข้า (การเคลื่อนไหวของกล้อง) เพื่อคงรายละเอียดระยะใกล้ของหยดน้ำ (การกระทำ)

พรอมต์

เอาต์พุตที่สร้างขึ้น

ภาพระยะใกล้ (องค์ประกอบ) ของน้ำแข็งย้อยที่กำลังละลาย (วัตถุ) บนกำแพงหินที่แข็งตัว (บริบท) ที่มีโทนสีน้ำเงินเย็น (บรรยากาศ) ซึ่งซูมเข้า (การเคลื่อนไหวของกล้อง) เพื่อคงรายละเอียดระยะใกล้ของหยดน้ำ (การกระทำ)

ผู้ชายคุยโทรศัพท์

วิดีโอเหล่านี้แสดงให้เห็นวิธีแก้ไขพรอมต์ด้วยรายละเอียดที่เฉพาะเจาะจงมากขึ้นเรื่อยๆ เพื่อให้ Veo ปรับแต่งเอาต์พุตตามที่คุณต้องการ

พรอมต์	เอาต์พุตที่สร้างขึ้น
รายละเอียดน้อยลง กล้องเลื่อนไปแสดงภาพระยะใกล้ของชายหนุ่มผู้สิ้นหวังใน ชุดเสื้อคลุมสีเขียว เขากำลังโทรออกด้วยโทรศัพท์ติดผนังสไตล์แป้นหมุนที่มี แสงไฟนีออนสีเขียว ดูเหมือนฉากในภาพยนตร์
รายละเอียดเพิ่มเติม ภาพระยะใกล้แบบภาพยนตร์ ติดตามชายหนุ่มผู้สิ้นหวังในชุดเสื้อคลุมสีเขียวที่ดูเก่า ขณะที่เขากำลังหมุนโทรศัพท์แป้นหมุนที่ติดอยู่บนกำแพงอิฐ ที่ดูเก่าและสกปรก โดยมีแสงไฟนีออนสีเขียวที่ส่องสว่างอย่างน่าขนลุก เป็นฉากหลัง กล้องซูมเข้าเผยให้เห็นความตึงเครียดที่กรามและ ความสิ้นหวังที่ปรากฏบนใบหน้าขณะที่เขาพยายามโทรออก ระยะชัดตื้นเน้นไปที่รอยย่นบนหน้าผากและโทรศัพท์โรตารีสีดำ เบลอพื้นหลังให้กลายเป็นทะเลสีนีออนและเงาที่ไม่ชัดเจน สร้างความรู้สึกเร่งด่วนและโดดเดี่ยว

พรอมต์

เอาต์พุตที่สร้างขึ้น

รายละเอียดน้อยลง
กล้องเลื่อนไปแสดงภาพระยะใกล้ของชายหนุ่มผู้สิ้นหวังใน ชุดเสื้อคลุมสีเขียว เขากำลังโทรออกด้วยโทรศัพท์ติดผนังสไตล์แป้นหมุนที่มี แสงไฟนีออนสีเขียว ดูเหมือนฉากในภาพยนตร์

รายละเอียดเพิ่มเติม
ภาพระยะใกล้แบบภาพยนตร์ ติดตามชายหนุ่มผู้สิ้นหวังในชุดเสื้อคลุมสีเขียวที่ดูเก่า ขณะที่เขากำลังหมุนโทรศัพท์แป้นหมุนที่ติดอยู่บนกำแพงอิฐ ที่ดูเก่าและสกปรก โดยมีแสงไฟนีออนสีเขียวที่ส่องสว่างอย่างน่าขนลุก เป็นฉากหลัง กล้องซูมเข้าเผยให้เห็นความตึงเครียดที่กรามและ ความสิ้นหวังที่ปรากฏบนใบหน้าขณะที่เขาพยายามโทรออก ระยะชัดตื้นเน้นไปที่รอยย่นบนหน้าผากและโทรศัพท์โรตารีสีดำ เบลอพื้นหลังให้กลายเป็นทะเลสีนีออนและเงาที่ไม่ชัดเจน สร้างความรู้สึกเร่งด่วนและโดดเดี่ยว

เสือดาวหิมะ

พรอมต์	เอาต์พุตที่สร้างขึ้น
พรอมต์ง่ายๆ: สิ่งมีชีวิตน่ารักที่มีขนคล้ายเสือดาวหิมะกำลังเดินอยู่ในป่าฤดูหนาว เรนเดอร์สไตล์การ์ตูน 3 มิติ
พรอมต์แบบละเอียด: สร้างฉากแอนิเมชัน 3 มิติสั้นๆ ในสไตล์การ์ตูนที่สนุกสนาน สิ่งมีชีวิตน่ารัก ที่มีขนคล้ายเสือดาวหิมะ ดวงตาโตที่สื่ออารมณ์ และรูปร่างกลมมนที่เป็นมิตร เดินอย่างมีความสุขในป่าฤดูหนาวที่แปลกประหลาด ฉากควรมี ต้นไม้กลมๆ ที่ปกคลุมด้วยหิมะ เกล็ดหิมะที่ค่อยๆ ตกลงมา และแสงแดดอุ่นๆ ที่ส่องผ่านกิ่งไม้ การเคลื่อนไหวที่เด้งดึ๋งและรอยยิ้มกว้างของตัวละครควรสื่อถึงความสุขอย่างแท้จริง ใช้โทนที่สดใสและอบอุ่นหัวใจด้วย สีสันสดใสและภาพเคลื่อนไหวสนุกสนาน

พรอมต์

เอาต์พุตที่สร้างขึ้น

พรอมต์ง่ายๆ:
สิ่งมีชีวิตน่ารักที่มีขนคล้ายเสือดาวหิมะกำลังเดินอยู่ในป่าฤดูหนาว เรนเดอร์สไตล์การ์ตูน 3 มิติ

พรอมต์แบบละเอียด:
สร้างฉากแอนิเมชัน 3 มิติสั้นๆ ในสไตล์การ์ตูนที่สนุกสนาน สิ่งมีชีวิตน่ารัก ที่มีขนคล้ายเสือดาวหิมะ ดวงตาโตที่สื่ออารมณ์ และรูปร่างกลมมนที่เป็นมิตร เดินอย่างมีความสุขในป่าฤดูหนาวที่แปลกประหลาด ฉากควรมี ต้นไม้กลมๆ ที่ปกคลุมด้วยหิมะ เกล็ดหิมะที่ค่อยๆ ตกลงมา และแสงแดดอุ่นๆ ที่ส่องผ่านกิ่งไม้ การเคลื่อนไหวที่เด้งดึ๋งและรอยยิ้มกว้างของตัวละครควรสื่อถึงความสุขอย่างแท้จริง ใช้โทนที่สดใสและอบอุ่นหัวใจด้วย สีสันสดใสและภาพเคลื่อนไหวสนุกสนาน

ตัวอย่างตามองค์ประกอบการเขียน

ตัวอย่างเหล่านี้แสดงวิธีปรับแต่งพรอมต์ตามองค์ประกอบพื้นฐานแต่ละอย่าง

เรื่องและบริบท

ระบุโฟกัสหลัก (วัตถุ) และพื้นหลังหรือสภาพแวดล้อม (บริบท)

พรอมต์	เอาต์พุตที่สร้างขึ้น
ภาพเรนเดอร์สถาปัตยกรรมของอาคารอพาร์ตเมนต์คอนกรีตสีขาวที่มีรูปทรงออร์แกนิกที่ไหลลื่น ผสมผสานเข้ากับต้นไม้เขียวขจีและองค์ประกอบแห่งอนาคตได้อย่างลงตัว
ดาวเทียมลอยผ่านอวกาศโดยมีดวงจันทร์และดวงดาวบางดวงเป็นฉากหลัง

พรอมต์

เอาต์พุตที่สร้างขึ้น

ภาพเรนเดอร์สถาปัตยกรรมของอาคารอพาร์ตเมนต์คอนกรีตสีขาวที่มีรูปทรงออร์แกนิกที่ไหลลื่น ผสมผสานเข้ากับต้นไม้เขียวขจีและองค์ประกอบแห่งอนาคตได้อย่างลงตัว

ดาวเทียมลอยผ่านอวกาศโดยมีดวงจันทร์และดวงดาวบางดวงเป็นฉากหลัง

การดำเนินการ

ระบุสิ่งที่บุคคลกำลังทำ (เช่น เดิน วิ่ง หรือหันศีรษะ)

พรอมต์	เอาต์พุตที่สร้างขึ้น
ภาพมุมกว้างของหญิงสาวเดินเล่นริมชายหาด ดูมีความสุขและผ่อนคลายขณะมองไปยังขอบฟ้าตอนพระอาทิตย์ตก

รูปแบบ

เพิ่มคีย์เวิร์ดเพื่อนำการสร้างไปสู่สุนทรียะที่เฉพาะเจาะจง (เช่น เหนือจริง ย้อนยุค อนาคต ฟิล์มนัวร์)

พรอมต์	เอาต์พุตที่สร้างขึ้น
สไตล์ฟิล์มนัวร์ ชายและหญิงเดินบนถนน ลึกลับ ภาพยนตร์ ขาวดำ

การเคลื่อนไหวและการจัดองค์ประกอบของกล้อง

ระบุวิธีที่กล้องเคลื่อนไหว (ภาพมุมมองบุคคลที่หนึ่ง มุมมองจากด้านบน มุมมองโดรนติดตาม) และ วิธีจัดเฟรมภาพ (ภาพมุมกว้าง ภาพระยะใกล้ ภาพมุมต่ำ)

พรอมต์	เอาต์พุตที่สร้างขึ้น
ภาพมุมมองบุคคลที่หนึ่งจากรถยนต์โบราณที่ขับท่ามกลางสายฝนในแคนาดาตอนกลางคืน ภาพยนตร์
ภาพระยะใกล้สุดๆ ของดวงตาที่มีภาพเมืองสะท้อนอยู่

สภาพแวดล้อม

ชุดสีและแสงไฟมีผลต่ออารมณ์ ลองใช้คำอย่าง "สีส้มหม่น โทนสีอบอุ่น" "แสงธรรมชาติ" "พระอาทิตย์ขึ้น" หรือ "โทนสีน้ำเงินเย็น"

พรอมต์	เอาต์พุตที่สร้างขึ้น
ภาพระยะใกล้ของเด็กหญิงที่อุ้มลูกสุนัขโกลเด้นรีทรีฟเวอร์น่ารักในสวนสาธารณะที่มีแสงแดดส่อง
ภาพระยะใกล้แบบภาพยนตร์ของผู้หญิงเศร้าที่นั่งรถประจำทางในสายฝน โทนสีน้ำเงินเย็นๆ บรรยากาศเศร้า

พรอมต์เชิงลบ

พรอมต์เชิงลบจะระบุองค์ประกอบที่คุณไม่ต้องการในวิดีโอ

❌ อย่าใช้ภาษาที่สั่งการ เช่น ไม่ หรืออย่า (เช่น "ไม่มีกำแพง")
✅ อธิบายสิ่งที่คุณไม่ต้องการเห็น (เช่น "wall, frame")

พรอมต์	เอาต์พุตที่สร้างขึ้น
ไม่มีพรอมต์เชิงลบ: สร้างภาพเคลื่อนไหวสั้นๆ ที่มีสไตล์ของต้นโอ๊กขนาดใหญ่ที่ขึ้นโดดเดี่ยว โดยมีใบไม้พัดไหวอย่างรุนแรงในลมแรง... [ย่อ]
พร้อมพรอมต์เชิงลบ: [พรอมต์เดียวกัน] พรอมต์เชิงลบ: พื้นหลังเป็นเมือง โครงสร้างที่มนุษย์สร้างขึ้น บรรยากาศมืดครึ้ม พายุ หรือน่ากลัว

สัดส่วนภาพ

Veo ช่วยให้คุณระบุสัดส่วนภาพสำหรับวิดีโอได้

พรอมต์	เอาต์พุตที่สร้างขึ้น
จอกว้าง (16:9) สร้างวิดีโอที่มีมุมมองจากโดรนติดตามชายคนหนึ่งที่ขับรถเปิดประทุนสีแดงในปาล์มสปริงส์ ช่วงทศวรรษ 1970 โดยมีแสงแดดอุ่นๆ และเงายาวๆ
แนวตั้ง (9:16 - Veo 2 เท่านั้น) สร้างวิดีโอที่เน้นการเคลื่อนไหวที่ราบรื่นของน้ำตกฮาวายที่งดงามภายในป่าฝนที่เขียวชอุ่ม เน้นที่การไหลของน้ำที่สมจริง ใบไม้ที่มีรายละเอียด และแสงธรรมชาติเพื่อสื่อถึงความเงียบสงบ บันทึกภาพน้ำที่ไหลเชี่ยว บรรยากาศที่เต็มไปด้วยหมอก และแสงแดดที่ส่องลอดผ่านร่มเงาของต้นไม้หนาแน่น ใช้การเคลื่อนกล้องที่ราบรื่นและเป็นภาพยนตร์เพื่อแสดงน้ำตกและสภาพแวดล้อมโดยรอบ ตั้งเป้าหมายให้มีน้ำเสียงที่สงบและสมจริง เพื่อนำผู้ชมไปยังความงามอันเงียบสงบของป่าฝนในฮาวาย

พรอมต์

เอาต์พุตที่สร้างขึ้น

จอกว้าง (16:9)
สร้างวิดีโอที่มีมุมมองจากโดรนติดตามชายคนหนึ่งที่ขับรถเปิดประทุนสีแดงในปาล์มสปริงส์ ช่วงทศวรรษ 1970 โดยมีแสงแดดอุ่นๆ และเงายาวๆ

ชายคนหนึ่งขับรถเปิดประทุนสีแดงใน Palm Springs ในสไตล์ยุค 1970

แนวตั้ง (9:16 - Veo 2 เท่านั้น)
สร้างวิดีโอที่เน้นการเคลื่อนไหวที่ราบรื่นของน้ำตกฮาวายที่งดงามภายในป่าฝนที่เขียวชอุ่ม เน้นที่การไหลของน้ำที่สมจริง ใบไม้ที่มีรายละเอียด และแสงธรรมชาติเพื่อสื่อถึงความเงียบสงบ บันทึกภาพน้ำที่ไหลเชี่ยว บรรยากาศที่เต็มไปด้วยหมอก และแสงแดดที่ส่องลอดผ่านร่มเงาของต้นไม้หนาแน่น ใช้การเคลื่อนกล้องที่ราบรื่นและเป็นภาพยนตร์เพื่อแสดงน้ำตกและสภาพแวดล้อมโดยรอบ ตั้งเป้าหมายให้มีน้ำเสียงที่สงบและสมจริง เพื่อนำผู้ชมไปยังความงามอันเงียบสงบของป่าฝนในฮาวาย

ข้อจำกัด

เวลาในการตอบสนองของคำขอ: ขั้นต่ำ: 11 วินาที สูงสุด: 6 นาที (ในช่วงเวลาที่มีการใช้งานสูงสุด)
ข้อจำกัดระดับภูมิภาค: ในสหภาพยุโรป สหราชอาณาจักร สวิตเซอร์แลนด์ และภูมิภาค MENA ค่าที่อนุญาตสำหรับ personGeneration มีดังนี้
- Veo 3: allow_adult เท่านั้น
- Veo 2: dont_allow และ allow_adult ค่าเริ่มต้นคือ dont_allow
การเก็บรักษาวิดีโอ: ระบบจะจัดเก็บวิดีโอที่สร้างขึ้นไว้ในเซิร์ฟเวอร์เป็นเวลา 2 วัน หลังจากนั้นระบบจะนำวิดีโอออก หากต้องการบันทึกสำเนาในเครื่อง คุณต้องดาวน์โหลดวิดีโอภายใน 2 วันหลังจากสร้าง
การใส่ลายน้ำ: วิดีโอที่สร้างโดย Veo จะมีลายน้ำโดยใช้ SynthID ซึ่งเป็นเครื่องมือสำหรับการใส่ลายน้ำ และระบุเนื้อหาที่ AI สร้างขึ้น
ความปลอดภัย: วิดีโอที่สร้างขึ้นจะผ่านตัวกรองความปลอดภัยและ กระบวนการตรวจสอบการจดจำ ซึ่งช่วยลดความเสี่ยงด้านความเป็นส่วนตัว ลิขสิทธิ์ และ อคติ
ข้อผิดพลาดเกี่ยวกับเสียง: บางครั้ง Veo 3 จะบล็อกไม่ให้สร้างวิดีโอเนื่องจาก ตัวกรองความปลอดภัยหรือปัญหาการประมวลผลอื่นๆ เกี่ยวกับเสียง ระบบจะไม่ เรียกเก็บเงินหากวิดีโอถูกบล็อกไม่ให้สร้าง

เวอร์ชันของโมเดล

Veo 3 เวอร์ชันตัวอย่าง

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `veo-3.0-generate-preview`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ รูปภาพ เอาต์พุต วิดีโอพร้อมเสียง
Limits	การป้อนข้อความ 1,024 โทเค็น วิดีโอเอาต์พุต 1
การอัปเดตล่าสุด	กรกฎาคม 2025

Veo 3 Fast เวอร์ชันตัวอย่าง

Veo 3 Fast ช่วยให้นักพัฒนาแอปสร้างวิดีโอพร้อมเสียงได้ในขณะที่ยังคงรักษาคุณภาพระดับสูงไว้ได้ รวมถึงเพิ่มประสิทธิภาพเพื่อความรวดเร็วและกรณีการใช้งานทางธุรกิจ เหมาะสำหรับบริการแบ็กเอนด์ที่สร้างโฆษณาโดยอัตโนมัติ เครื่องมือสำหรับการทดสอบ A/B อย่างรวดเร็วของแนวคิดครีเอทีฟโฆษณา หรือแอปที่ต้องสร้างเนื้อหาโซเชียลมีเดียอย่างรวดเร็ว

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `veo-3.0-fast-generate-preview`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ รูปภาพ เอาต์พุต วิดีโอพร้อมเสียง
Limits	การป้อนข้อความ 1,024 โทเค็น วิดีโอเอาต์พุต 1
การอัปเดตล่าสุด	กรกฎาคม 2025

Veo 2

พร็อพเพอร์ตี้	คำอธิบาย
รหัสโมเดล	Gemini API `veo-2.0-generate-001`
ประเภทข้อมูลที่รองรับ	อินพุต ข้อความ รูปภาพ เอาต์พุต วิดีโอ
Limits	การป้อนข้อความ ไม่มี อินพุตรูปภาพ ความละเอียดและสัดส่วนภาพใดก็ได้ที่มีขนาดไฟล์ไม่เกิน 20 MB วิดีโอเอาต์พุต สูงสุด 2 รายการ
การอัปเดตล่าสุด	เมษายน 2025

ขั้นตอนถัดไป

เริ่มต้นใช้งาน Veo 3 API โดยทดลองใช้ใน Veo Quickstart Colab
ดูวิธีเขียนพรอมต์ให้ดียิ่งขึ้นด้วยข้อมูลเบื้องต้นเกี่ยวกับการออกแบบพรอมต์