- Blog
- Guide du Workflow Vidéo Omni Gemini : Comment Rédiger un Brief pour un Modèle Vidéo IA en 2026
Guide du Workflow Vidéo Omni Gemini : Comment Rédiger un Brief pour un Modèle Vidéo IA en 2026
La génération vidéo par Gemini est passée d'une simple boîte de prompts expérimentale à un workflow créatif concret. L'expérience actuelle de Veo 3.1 chez Google met l'accent sur des vidéos de 8 secondes avec son dans Gemini Apps, une meilleure qualité image-vers-vidéo, des formats verticaux et des contrôles enrichis dans Flow, l'API Gemini et Vertex AI. Le changement important ne réside pas seulement dans des pixels améliorés : les équipes de production doivent désormais faire collaborer prompts, médias de référence, intention audio et stratégie de réessai.
Points clés à retenir
- Traitez un prompt vidéo IA comme un brief de plan, pas comme une légende.
- Rédigez la caméra, le sujet, le mouvement, l'éclairage, le timing et le son dans des clauses séparées.
- Utilisez des images de référence pour l'identité, le produit, l'environnement ou le style, mais décidez de la responsabilité de chaque référence.
- Gardez la première génération ciblée, puis itérez avec des modifications ou des paramètres restaurés au lieu de tout réécrire depuis zéro.
Qu'est-ce qui a changé avec Veo 3.1 ?
Google décrit Veo 3.1 comme une version axée sur un audio plus riche, un meilleur contrôle narratif, une adhésion plus forte aux prompts et une qualité audiovisuelle améliorée lors de la transformation d'images en vidéos. Flow a également ajouté plus de contrôle autour des images de référence, des workflows première/dernière image, de l'extension de scène et des modifications au niveau des objets.
Pour les créateurs, cela signifie qu'un bon brief doit désormais répondre à quatre questions :
- Qu'est-ce qui doit rester cohérent ?
- Qu'est-ce qui doit bouger ?
- Que doit faire la caméra ?
- Que doit entendre le spectateur ?
Si le prompt dit simplement « faites une vidéo produit cinématographique », le modèle doit inventer les quatre réponses. Si le prompt dit « plan macro produit de 8 secondes, la caméra avance lentement de l'étiquette au bouchon, des perles de condensation glissent sur le verre, doux reflet de studio, pulsation synthétique basse et bruitage subtil de manipulation de la bouteille », la génération a une cible beaucoup plus précise.
Une structure de prompt pratique
Utilisez ce format pour la plupart des travaux texte-vers-vidéo et image-vers-vidéo :
Sujet : un sujet, produit, personnage ou scène clair.
Action : ce qui change pendant le plan.
Caméra : taille du plan, mouvement, angle, sensation d'objectif.
Éclairage et aspect : moment de la journée, palette, réalisme, texture.
Audio : ambiance, dialogue, musique, bruitage, ou silence.
Contraintes : éviter le texte, éviter les personnes supplémentaires, garder le logo lisible, pas de coupures de scène.
Exemple :
Sujet : une trottinette électrique noire mate garée devant un hall d'immeuble de bureaux en verre.
Action : des gouttes de pluie roulent sur le guidon tandis que le phare s'allume.
Caméra : plan rapproché en contre-plongée 35 mm de la roue avant au phare, sans coupure.
Éclairage et aspect : heure bleue, reflets sur le trottoir mouillé, éclairage commercial réaliste.
Audio : pluie urbaine douce, circulation lointaine, léger son de démarrage électrique.
Contraintes : pas de personnes, pas de texte de vitrine lisible, garder les proportions de la trottinette inchangées.
Comment utiliser les références sans embrouiller le modèle
Les images de référence sont plus efficaces quand chacune a un rôle précis. N'upload pas cinq images sans lien et n'attends pas que le modèle devine tes goûts.
| Objectif de la référence | Bon exemple | Instruction dans le prompt |
|---|---|---|
| Identité du personnage | Portrait net de face | "Garde le même visage, les cheveux et la tenue." |
| Précision du produit | Photo produit sur fond neutre | "Conserve la forme, la couleur, l'emplacement de l'étiquette et le matériau." |
| Environnement | Photo d'une pièce ou d'une rue | "Utilise la disposition de ce lieu et l'ambiance lumineuse." |
| Style | Image fixe ou tableau d'inspiration | "Utilise cette palette, ce contraste et cette texture, pas le sujet." |
| Transition de mouvement | Image de début et de fin | "Crée une transition continue entre ces deux images." |
La documentation Vertex AI de Google précise que Veo prend en charge le prompt, le guidage par image, le guidage par dernière image, les images de référence, le format d'image, la durée, la génération audio, les prompts négatifs, la seed et les contrôles de résolution sur les modèles compatibles. La leçon pratique est simple : quand une interface expose ces paramètres, sauvegarde-les avec le prompt. Sinon, l'équipe ne pourra pas reproduire un clip réussi.
Une boucle de réessai qui économise des crédits
Ne fais pas de chaque réessai un tout nouveau prompt. Utilise une boucle en trois passes :
- Passe de composition : obtiens le bon sujet, cadrage et direction du mouvement. Ignore les artefacts mineurs.
- Passe de contrôle : modifie une ou deux variables, comme la vitesse de la caméra ou l'arrière-plan.
- Passe de finition : affine l'audio, l'éclairage, le recadrage et la résolution de sortie.
Pour les clips courts, le plus gros gaspillage est de changer cinq variables à la fois. Tu ne peux pas savoir quel changement a corrigé ou cassé le résultat. Un système d'historique utilisable doit conserver le prompt, le modèle, le mode, le format d'image, la durée, la résolution, le réglage sonore et les médias de référence pour que la passe suivante parte d'un état connu.
Sources
- Google : Bringing new Veo 3.1 updates into Flow
- Google : Generate videos with Gemini Apps
- Google Cloud : Veo on Vertex AI video generation API