- 블로그
- Gemini Omni 비디오 워크플로우 가이드: 2026년 AI 비디오 모델 브리핑하는 방법
Gemini Omni 비디오 워크플로우 가이드: 2026년 AI 비디오 모델 브리핑하는 방법
Gemini 비디오 생성은 단순한 프롬프트 상자에서 실용적인 창의적 워크플로우로 진화했습니다. Google의 최신 Veo 3.1 경험은 Gemini Apps에서 사운드가 포함된 8초 비디오, 향상된 이미지-투-비디오 품질, 세로 형식, 그리고 Flow, Gemini API, Vertex AI에서 더 풍부한 제어 기능을 강조합니다. 중요한 변화는 단순히 더 나은 픽셀이 아닙니다: 이제 프로덕션 팀은 프롬프트, 참조 미디어, 오디오 의도, 재시도 전략이 함께 작동해야 합니다.
핵심 요점
- AI 비디오 프롬프트를 캡션이 아닌 쇼트 브리프로 취급하세요.
- 카메라, 피사체, 움직임, 조명, 타이밍, 사운드를 별도의 절로 작성하세요.
- 정체성, 제품, 환경 또는 스타일을 위해 참조 이미지를 사용하되, 각 참조가 담당하는 부분을 명확히 하세요.
- 첫 번째 생성은 좁게 설정하고, 처음부터 다시 작성하는 대신 편집이나 복원된 파라미터로 반복하세요.
Veo 3.1에서 무엇이 바뀌었나요?
Google은 Veo 3.1을 더 풍부한 오디오, 더 강력한 내러티브 제어, 향상된 프롬프트 준수, 그리고 이미지를 비디오로 변환할 때 개선된 시청각 품질에 초점을 맞춘 릴리스로 설명합니다. Flow는 또한 참조 이미지, 첫 번째/마지막 프레임 워크플로우, 장면 확장, 객체 수준 편집에 대한 더 많은 제어 기능을 추가했습니다.
크리에이터에게 이는 좋은 브리프가 이제 네 가지 질문에 답해야 함을 의미합니다:
- 무엇이 일관되게 유지되어야 하는가?
- 무엇이 움직여야 하는가?
- 카메라는 무엇을 해야 하는가?
- 시청자는 무엇을 들어야 하는가?
프롬프트가 단순히 "시네마틱 제품 비디오를 만들어줘"라고만 말하면, 모델은 네 가지 답변을 모두 스스로 창작해야 합니다. 프롬프트가 "8초 매크로 제품 쇼트, 카메라가 라벨에서 캡으로 천천히 푸시인, 응축 방울이 유리병 아래로 미끄러짐, 부드러운 스튜디오 반사, 낮은 신스 펄스와 미세한 병 핸들링 폴리"라고 말하면, 생성 범위가 훨씬 좁아집니다.
실용적인 프롬프트 구조
대부분의 텍스트-투-비디오 및 이미지-투-비디오 작업에 이 형식을 사용하세요:
피사체: 하나의 명확한 피사체, 제품, 캐릭터 또는 장면.
동작: 쇼트 중에 변화하는 것.
카메라: 쇼트 크기, 움직임, 각도, 렌즈 느낌.
조명 및 룩: 시간대, 팔레트, 사실감, 질감.
오디오: 앰비언스, 대화, 음악, 폴리, 또는 무음.
제약사항: 텍스트 금지, 추가 인물 금지, 로고 읽기 가능 유지, 장면 전환 금지.
예시:
피사체: 유리 오피스 로비 밖에 주차된 매트 블랙 전동 스쿠터.
동작: 핸들바 위로 빗방울이 굴러가고 헤드라이트가 켜짐.
카메라: 로우앵글 35mm 푸시인, 앞바퀴에서 헤드라이트로, 컷 없음.
조명 및 룩: 블루아워, 젖은 도로 반사, 사실적인 상업 조명.
오디오: 부드러운 도시 빗소리, 먼 차량 소음, 미세한 전동 시동음.
제약사항: 사람 없음, 읽을 수 있는 상점 텍스트 없음, 스쿠터 비율 변경 금지.
모델을 혼란스럽게 하지 않고 참조 이미지를 사용하는 방법
참조 이미지는 각각 명확한 역할이 있을 때 가장 효과적입니다. 서로 관련 없는 이미지 다섯 장을 업로드하고 모델이 당신의 취향을 추론하길 기대해서는 안 됩니다.
| 참조 목적 | 좋은 입력 예시 | 프롬프트 지시사항 |
|---|---|---|
| 캐릭터 동일성 | 정면 클린 초상화 | "같은 얼굴, 헤어스타일, 의상을 유지하세요." |
| 제품 정확성 | 단색 배경의 제품 팩샷 | "형태, 색상, 라벨 위치, 소재를 보존하세요." |
| 환경 | 방 또는 거리 사진 | "이 장소의 레이아웃과 조명 분위기를 사용하세요." |
| 스타일 | 스틸 프레임 또는 아트 디렉션 보드 | "주제가 아닌 이 팔레트, 대비, 질감을 사용하세요." |
| 모션 브릿지 | 시작 프레임과 끝 프레임 | "이 프레임들 사이의 연속적인 전환을 만드세요." |
Google의 Vertex AI 문서에 따르면, Veo는 지원되는 모델 전반에 걸쳐 프롬프트, 이미지 가이던스, 마지막 프레임 가이던스, 참조 이미지, 화면비, 지속 시간, 오디오 생성, 네거티브 프롬프트, 시드, 해상도 제어 기능을 지원합니다. 운영상의 교훈은 간단합니다. UI에서 이러한 설정이 노출될 때는 프롬프트와 함께 저장하세요. 그렇지 않으면 팀이 성공적인 클립을 재현할 수 없습니다.
크레딧을 절약하는 재시도 루프
모든 재시도를 완전히 새로운 프롬프트로 만들지 마세요. 3단계 루프를 사용하세요:
- 구성 패스: 피사체, 프레이밍, 모션 방향을 올바르게 잡습니다. 사소한 아티팩트는 무시하세요.
- 제어 패스: 카메라 속도나 배경 등 한두 가지 변수를 변경합니다.
- 마무리 패스: 오디오, 조명, 크롭, 출력 해상도를 정교하게 다듬습니다.
짧은 클립의 경우, 한 번에 다섯 가지 변수를 변경하는 것이 가장 큰 낭비입니다. 어떤 변경이 결과를 개선했는지 혹은 망가뜨렸는지 알 수 없습니다. 유용한 히스토리 시스템은 프롬프트, 모델, 모드, 화면비, 지속 시간, 해상도, 사운드 설정, 참조 미디어를 보존하여 다음 패스가 알려진 상태에서 시작할 수 있도록 해야 합니다.
출처
- Google: Bringing new Veo 3.1 updates into Flow
- Google: Generate videos with Gemini Apps
- Google Cloud: Veo on Vertex AI video generation API