- บล็อก
- Gemini Omni vs Veo 3: เลเยอร์แก้ไขแบบสนทนา หรือ API วิดีโอสำหรับงานผลิต
Gemini Omni vs Veo 3: เลเยอร์แก้ไขแบบสนทนา หรือ API วิดีโอสำหรับงานผลิต
Gemini Omni และ Veo 3 ไม่ได้ทำหน้าที่เดียวกัน Omni คือเลเยอร์สร้างและแก้ไขวิดีโอแบบมัลติโหมดด้วยบทสนทนาของ Google ส่วน Veo 3 คือเส้นทางงานผลิตที่มีเอกสารชัดเจนกว่าสำหรับวิดีโอพร้อมเสียง

สรุปสั้น: ใช้ Gemini Omni เมื่ออยากเริ่มจากอินพุตหลายแบบและแก้ต่อด้วยภาษาธรรมชาติ ใช้ Veo 3 เมื่อทีมต้องการ API ราคา และคอนโทรลงานผลิตที่ชัดกว่า
อะไรเปลี่ยนไป
Google เปิดตัว Gemini Omni วันที่ 19 พฤษภาคม 2026 โมเดลแรกคือ Gemini Omni Flash ซึ่งเริ่มเข้าสู่ Gemini, Google Flow และเครื่องมือสร้างคอนเทนต์ของ YouTube Google อธิบายว่า Omni สามารถสร้างจากข้อความ รูปภาพ เสียง และวิดีโอ แล้วแก้ผลลัพธ์ต่อผ่านคำสั่งแบบสนทนาได้
Veo 3 ยังเป็นฐานงานผลิตสำคัญ เพราะเส้นทางนักพัฒนา model ID การสร้างเสียง ราคา และ workflow ใน Flow หรือ Vertex มีเอกสารชัดกว่า หน้า Veo ปัจจุบันยังวาง Veo 3.1 เป็นสายวิดีโอที่ควบคุมได้สูง พร้อมเสียง native การทำตาม prompt reference workflow และ safety evaluation
| คำถาม | Gemini Omni | Veo 3 |
|---|---|---|
| ใช้ก่อนกับอะไร | สร้างและแก้แบบสนทนา | text/image-to-video สำหรับงานผลิต |
| อินพุต | ข้อความ รูป เสียง วิดีโอ เป็น brief เดียว | prompt และ reference ผ่าน Gemini, Flow, API, Vertex |
| จุดแข็ง | แก้หลายรอบ world knowledge ผสม reference | control มีเอกสาร เสียง native ต้นทุน API ชัดกว่า |
| ความเสี่ยง | API และราคายังอยู่ระหว่างเปิดเผย | สนทนาน้อยกว่า คล้าย model endpoint |
เลือก Omni เมื่อ
- ต้องการแก้คลิปเดิมด้วยภาษาธรรมชาติ;
- reference แต่ละชิ้นมีหน้าที่ต่างกัน เช่น motion, identity, style;
- วิดีโอต้องพึ่งฟิสิกส์ ประวัติศาสตร์ วิทยาศาสตร์ หรือ explainer;
- ประสบการณ์ creator สำคัญกว่า API contract คงที่
เลือก Veo 3 เมื่อ
- ต้องการราคา model ID และ integration ที่ทำซ้ำได้;
- เป็นวิดีโอสินค้า โฆษณา trailer สั้น หรือ social video พร้อมเสียง;
- ต้องการฐานที่เสถียรก่อน Omni API เปิด;
- ต้องเก็บ settings และ parameters เพื่อ review
Sources
- Google: https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-omni/
- Google DeepMind: https://deepmind.google/models/gemini-omni/
- Google DeepMind Veo: https://deepmind.google/models/veo/