- บล็อก
- รายการตรวจสอบภาพอ้างอิง AI Video: วิธีได้ผลลัพธ์ที่นำกลับมาใช้ซ้ำได้
รายการตรวจสอบภาพอ้างอิง AI Video: วิธีได้ผลลัพธ์ที่นำกลับมาใช้ซ้ำได้
ภาพอ้างอิงสามารถทำให้การสร้างวิดีโอ AI ควบคุมได้ง่ายขึ้นอย่างมาก แต่จะเกิดผลก็ต่อเมื่อเตรียมภาพเหล่านั้นเหมือนทรัพยากรการผลิต ชุดอ้างอิงที่รกทำให้โมเดลต้องเดา ในขณะที่ชุดอ้างอิงที่สะอาดบอกโมเดลว่าต้องรักษาอะไร เคลื่อนไหวอะไร และละเว้นอะไร
รายการตรวจสอบนี้สำหรับนักการตลาดผลิตภัณฑ์ ครีเอเตอร์ และทีมที่สร้างเวิร์กโฟลว์ภาพเป็นวิดีโอที่ทำซ้ำได้
กฎห้าภาพอ้างอิง
ก่อนอัปโหลดอะไร ให้ติดป้ายกำกับภาพอ้างอิงแต่ละภาพด้วยหนึ่งในห้าบทบาท:
- เอกลักษณ์: บุคคล ตัวละคร มาสคอต หรือผลิตภัณฑ์ที่ต้องคงไว้ซึ่งการจดจำ
- เรขาคณิต: รูปทรง โครงร่าง บรรจุภัณฑ์ เลย์เอาต์ หรือโครงสร้างห้อง
- วัสดุ: ผ้า แก้ว โลหะ พื้นผิวหนัง พื้นผิวอาหาร หรือพื้นผิวแสง
- สภาพแวดล้อม: สถานที่ ฉากหลัง สภาพอากาศ ช่วงเวลาของวัน
- การเคลื่อนไหว: ท่าทาง เฟรม หรือคลิปก่อนหน้าที่บ่งบอกถึงการเคลื่อนไหว
หากภาพอ้างอิงไม่มีบทบาท ให้เอาออก ภาพอ้างอิงมากขึ้นไม่ได้หมายถึงการควบคุมที่มากขึ้นโดยอัตโนมัติ
อินพุตที่สะอาดดีกว่าพรอมต์ที่ฉลาด
ใช้ภาพอ้างอิงที่:
- มีความละเอียดสูงพอที่จะแสดงรายละเอียดที่คุณสนใจ
- ไม่ผ่านฟิลเตอร์หนักๆ เว้นแต่ฟิลเตอร์นั้นคือเป้าหมายของสไตล์
- ปราศจากลายน้ำ UI ซ้อนทับ และข้อความสุ่ม
- ถูกครอบตัดรอบวัตถุสำคัญ
- มีแสงที่สม่ำเสมอเมื่อความถูกต้องของเอกลักษณ์หรือผลิตภัณฑ์สำคัญ
หากป้ายผลิตภัณฑ์เล็กเกินไปในภาพที่อัปโหลด อย่าคาดหวังให้โมเดลรักษาไว้ อัปโหลดภาพ packshot ที่สะอาดและบอกโมเดลว่ารายละเอียดใดสำคัญ
พรอมต์ภาพอ้างอิงแต่ละภาพอย่างชัดเจน
ไม่ดี:
ใช้ภาพอ้างอิงเหล่านี้เพื่อสร้างวิดีโอแฟชั่นที่เจ๋ง
ดีกว่า:
ใช้ภาพอ้างอิง 1 สำหรับใบหน้าและชุดของนางแบบ ใช้ภาพอ้างอิง 2 สำหรับแสงในสตูดิโอและฉากหลังสีเทา ใช้ภาพอ้างอิง 3 สำหรับรูปทรงกระเป๋าถือและพื้นผิวหนังเท่านั้น สร้างวิดีโอ 8 วินาทีแบบค่อยๆ ซูมเข้าพร้อมการเคลื่อนไหวของผ้าที่ละเอียดอ่อน อย่าเปลี่ยนใบหน้า สีชุด หรือสัดส่วนกระเป๋าถือ
เก็บรักษาอินพุตที่สำเร็จ
เวิร์กโฟลว์ภาพอ้างอิงที่ดีที่สุดไม่ใช่แค่เรื่องคุณภาพการอัปโหลดเท่านั้น แต่ยังต้องมีความคงทน เมื่อการสร้างผลงานสำเร็จ ให้บันทึกการตั้งค่าทั้งหมด:
| ฟิลด์ | เหตุผลที่สำคัญ |
|---|---|
| พรอมต์ | บันทึกคำแนะนำเชิงสร้างสรรค์ |
| โมเดลและโหมด | Text-to-video และ image-to-video มีพฤติกรรมต่างกัน |
| อัตราส่วนภาพ | ช็อตแนวตั้งและแนวนอนมีองค์ประกอบต่างกัน |
| ระยะเวลา | จังหวะการเคลื่อนไหวเปลี่ยนไปตามความยาว |
| ความละเอียด | ส่งผลต่อคุณภาพงานสำเร็จและต้นทุนเครดิต |
| การตั้งค่าเสียง | กำหนดว่าต้องกำหนดทิศทางเสียงหรือไม่ |
| URL ภาพอ้างอิง | ให้ทีมสร้างใหม่หรือปรับแต่งในภายหลัง |
| URL ผลลัพธ์ | เก็บทรัพยากรที่สร้างไว้หลังจากลิงก์ชั่วคราวหมดอายุ |
หากอินพุตเหล่านี้ถูกจัดเก็บ ประวัติศาสตร์จะกลายเป็นเครื่องมือการผลิตแทนที่จะเป็นแกลเลอรี สมาชิกในทีมสามารถคลิกผลงานเก่า กู้คืนพรอมต์และภาพอ้างอิงดั้งเดิม ปรับเปลี่ยนตัวแปรหนึ่งตัว และสร้างรูปแบบที่ควบคุมได้
เวิร์กโฟลว์ที่ทำซ้ำได้
ใช้จังหวะการทำงานดังนี้:
- อัปโหลดเฉพาะข้อมูลอ้างอิงที่มีบทบาทชัดเจนเท่านั้น
- เขียนพรอมต์ที่กำหนดหน้าที่ให้ข้อมูลอ้างอิงแต่ละชิ้น
- สร้างคลิปแรกด้วยการตั้งค่าราคาถูกที่สุดที่ยอมรับได้
- แก้ไของค์ประกอบก่อนแก้ไขรายละเอียด
- บันทึกการตั้งค่าที่ใช้ได้ผลก่อนเพิ่มความละเอียด
- นำข้อมูลอ้างอิงชุดเดิมกลับมาใช้ซ้ำสำหรับรูปแบบต่างๆ แทนการอัปโหลดภาพครอบตัดใหม่
โหมดความล้มเหลวทั่วไป
| ความล้มเหลว | สาเหตุที่เป็นไปได้ | วิธีแก้ไข |
|---|---|---|
| ใบหน้าเปลี่ยนไปในแต่ละช็อต | ข้อมูลอ้างอิงเอกลักษณ์ไม่ชัดเจน หรือปนกับข้อมูลอ้างอิงสไตล์ | ใช้ภาพพอร์ตเทรตที่ชัดเจนหนึ่งภาพและระบุ "คงเอกลักษณ์ไว้" |
| รูปร่างสินค้าเปลี่ยนไป | พรอมต์ขอให้มีการเคลื่อนไหวที่ทำให้สินค้าบิดเบี้ยว | เพิ่ม "คงสัดส่วนไว้ไม่เปลี่ยนแปลง" และลดการเคลื่อนไหว |
| ฉากดูธรรมดาเกินไป | ข้อมูลอ้างอิงสภาพแวดล้อมอ่อนแอ | เพิ่มข้อมูลอ้างอิงสถานที่และบรรยายช่วงเวลาของวัน |
| เสียงดูสุ่มๆ | ไม่ได้กำหนดทิศทางของเสียง | ระบุบรรยากาศ เสียงประกอบ ดนตรี และบทสนทนาแยกกัน |
| การรันซ้ำไม่ตรงกับผลลัพธ์เดิม | ไม่ได้บันทึกอินพุต | เก็บพรอมต์ การตั้งค่า ข้อมูลอ้างอิง และ URL ผลลัพธ์ |
แหล่งที่มา
- Google Cloud: พารามิเตอร์ API การสร้างวิดีโอ Veo
- Google: อัปเดต Veo 3.1 ส่วนผสมสู่วิดีโอ
- ByteDance Seed: เปิดตัว Seedance 2.0 อย่างเป็นทางการ