- Blog
- Checklist des Images de Référence pour la Vidéo IA : Comment Obtenir des Résultats Réutilisables
Checklist des Images de Référence pour la Vidéo IA : Comment Obtenir des Résultats Réutilisables
Les images de référence peuvent rendre la génération vidéo par IA nettement plus contrôlable, mais seulement lorsqu'elles sont préparées comme des actifs de production. Un ensemble de références désordonné force le modèle à deviner. Un ensemble de références propre indique au modèle ce qu'il doit préserver, animer et ignorer.
Cette checklist est destinée aux marketeurs produit, créateurs et équipes construisant des workflows image-vers-vidéo reproductibles.
La règle des cinq références
Avant de télécharger quoi que ce soit, étiquetez chaque référence avec l'un des cinq rôles suivants :
- Identité : la personne, le personnage, la mascotte ou le produit qui doit rester reconnaissable.
- Géométrie : forme, silhouette, emballage, disposition ou structure de la pièce.
- Matériau : tissu, verre, métal, texture de peau, surface alimentaire ou texture d'éclairage.
- Environnement : lieu, arrière-plan, météo, heure de la journée.
- Mouvement : une pose, une image ou un clip précédent suggérant du mouvement.
Si une référence n'a pas de rôle, supprimez-la. Plus de références ne signifie pas automatiquement plus de contrôle.
Une entrée propre vaut mieux qu'un prompt astucieux
Utilisez des images de référence qui sont :
- En résolution suffisamment élevée pour montrer les détails qui comptent.
- Non fortement filtrées, sauf si le filtre est l'objectif de style.
- Sans filigranes, superpositions d'interface utilisateur ou texte aléatoire.
- Recadrées autour du sujet important.
- Cohérentes en éclairage lorsque l'identité ou la précision du produit est importante.
Si l'étiquette du produit est minuscule dans la photo téléchargée, n'attendez pas du modèle qu'il la préserve. Téléchargez un packshot propre et dites au modèle quels détails sont importants.
Formulez chaque référence explicitement
Mauvais :
Utilisez ces références pour créer une vidéo de mode cool.
Meilleur :
Utilisez la référence 1 pour le visage et la tenue du mannequin. Utilisez la référence 2 pour l'éclairage studio et le fond gris. Utilisez la référence 3 uniquement pour la forme du sac à main et la texture du cuir. Créez un lent zoom avant de 8 secondes avec un mouvement subtil du tissu. Ne modifiez pas le visage, la couleur de la tenue ou les proportions du sac à main.
Préservez les entrées réussies
Le meilleur workflow de référence ne concerne pas seulement la qualité du téléchargement. Il nécessite aussi de la persistance. Lorsqu'une génération fonctionne, sauvegardez la configuration complète :
| Champ | Pourquoi c'est important |
|---|---|
| Prompt | Capture l'instruction créative. |
| Modèle et mode | Texte-vers-vidéo et image-vers-vidéo se comportent différemment. |
| Format d'image | Les plans verticaux et paysages se composent différemment. |
| Durée | Le rythme du mouvement change avec la longueur. |
| Résolution | Affecte la qualité finale et le coût en crédits. |
| Paramètre sonore | Détermine si l'audio doit être dirigé. |
| URLs de référence | Permet à l'équipe de régénérer ou itérer plus tard. |
| URLs de sortie | Garde l'actif généré disponible après l'expiration des liens temporaires. |
Si ces entrées sont stockées, l'historique devient un outil de production plutôt qu'une galerie. Un collègue peut cliquer sur une ancienne génération, récupérer le prompt original et les références, ajuster une variable et générer une variation contrôlée.
Un flux de travail reproductible
Utilisez ce rythme opérationnel :
- Importez uniquement les références ayant un rôle clairement défini.
- Rédigez un prompt qui attribue une mission à chaque référence.
- Générez le premier clip au réglage le plus économique acceptable.
- Corrigez la composition avant d'affiner les détails.
- Sauvegardez la configuration de travail avant d'augmenter la résolution.
- Réutilisez les mêmes références pour les variantes au lieu de télécharger différents recadrages.
Modes d'échec courants
| Échec | Cause probable | Solution |
|---|---|---|
| Le visage change entre les plans | La référence d'identité est floue ou mélangée aux références de style | Utilisez un portrait net et dites « préserver l'identité ». |
| La forme du produit change | Le prompt demande un mouvement qui déforme le produit | Ajoutez « garder les proportions inchangées » et réduisez l'action. |
| La scène semble générique | La référence d'environnement est faible | Ajoutez une référence de lieu et décrivez l'heure de la journée. |
| L'audio semble aléatoire | Le son n'a pas été dirigé | Nommez l'ambiance, les bruitages, la musique et les dialogues séparément. |
| La nouvelle exécution ne correspond pas à l'ancien résultat | Les entrées n'ont pas été sauvegardées | Stockez le prompt, les réglages, les références et les URL des résultats. |
Sources
- Google Cloud : Paramètres de l'API de génération vidéo Veo
- Google : Mise à jour Veo 3.1 Ingrédients vers Vidéo
- ByteDance Seed : Lancement officiel de Seedance 2.0