- Blog
- Lista de Verificación para Imágenes de Referencia en Video con IA: Cómo Obtener Resultados Reutilizables
Lista de Verificación para Imágenes de Referencia en Video con IA: Cómo Obtener Resultados Reutilizables
Las imágenes de referencia pueden hacer que la generación de video con IA sea mucho más controlable, pero solo cuando se preparan como activos de producción. Un conjunto de referencias desordenado obliga al modelo a adivinar. Un conjunto limpio le indica al modelo qué preservar, qué animar y qué ignorar.
Esta lista es para creadores, equipos y profesionales de marketing de producto que construyen flujos de trabajo repetibles de imagen a video.
La regla de las cinco referencias
Antes de subir cualquier cosa, etiqueta cada referencia con uno de estos cinco roles:
- Identidad: la persona, personaje, mascota o producto que debe mantenerse reconocible.
- Geometría: forma, silueta, empaque, diseño o estructura de la habitación.
- Material: tela, vidrio, metal, textura de piel, superficie de alimentos o textura de iluminación.
- Entorno: ubicación, fondo, clima, hora del día.
- Movimiento: una pose, fotograma o clip anterior que sugiera movimiento.
Si una referencia no tiene un rol, elimínala. Más referencias no generan automáticamente más control.
Una entrada limpia supera a un prompt ingenioso
Usa imágenes de referencia que sean:
- De alta resolución suficiente para mostrar el detalle que te importa.
- Sin filtros pesados, a menos que el filtro sea el objetivo de estilo.
- Sin marcas de agua, superposiciones de interfaz ni texto aleatorio.
- Recortadas alrededor del sujeto importante.
- Consistentes en iluminación cuando la identidad o precisión del producto sea importante.
Si la etiqueta del producto es diminuta en la foto subida, no esperes que el modelo la preserve. Sube una foto limpia del empaque e indica al modelo qué detalles importan.
Indica cada referencia explícitamente
Mal:
Usa estas referencias para hacer un video de moda genial.
Mejor:
Usa la referencia 1 para el rostro y el atuendo de la modelo. Usa la referencia 2 para la iluminación de estudio y el fondo gris. Usa la referencia 3 solo para la forma del bolso y la textura del cuero. Crea un acercamiento lento de 8 segundos con movimiento sutil de la tela. No cambies el rostro, el color del atuendo ni las proporciones del bolso.
Conserva las entradas exitosas
El mejor flujo de trabajo con referencias no solo depende de la calidad de la subida. También necesita persistencia. Cuando una generación funciona, guarda la configuración completa:
| Campo | Por qué es importante |
|---|---|
| Prompt | Captura la instrucción creativa. |
| Modelo y modo | Texto a video e imagen a video se comportan de manera diferente. |
| Relación de aspecto | Los planos verticales y horizontales se componen de forma distinta. |
| Duración | El ritmo del movimiento cambia con la duración. |
| Resolución | Afecta la calidad final y el costo de créditos. |
| Configuración de sonido | Determina si el audio debe ser dirigido. |
| URLs de referencia | Permite al equipo regenerar o iterar después. |
| URLs de salida | Mantiene el activo generado disponible después de que los enlaces temporales caduquen. |
Si estas entradas se almacenan, el historial se convierte en una herramienta de producción en lugar de una galería. Un compañero de equipo puede hacer clic en una generación anterior, recuperar el prompt y las referencias originales, ajustar una variable y generar una variación controlada.
Un flujo de trabajo repetible
Utiliza este ritmo operativo:
- Sube solo las referencias que tengan un rol claro.
- Escribe un prompt que asigne a cada referencia una tarea.
- Genera el primer clip con la configuración más económica aceptable.
- Corrige la composición antes de ajustar los detalles.
- Guarda la configuración de trabajo antes de aumentar la resolución.
- Reutiliza las mismas referencias para variantes en lugar de volver a subir recortes diferentes.
Modos de fallo comunes
| Falla | Causa probable | Solución |
|---|---|---|
| El rostro cambia entre tomas | La referencia de identidad es confusa o está mezclada con referencias de estilo | Usa un retrato limpio y di "preservar identidad". |
| La forma del producto cambia | El prompt pide movimiento que deforma el producto | Agrega "mantener proporciones sin cambios" y reduce la acción. |
| La escena se ve genérica | La referencia de entorno es débil | Añade una referencia de ubicación y describe la hora del día. |
| El audio se siente aleatorio | El sonido no fue dirigido | Nombra ambiente, foley, música y diálogo por separado. |
| No se puede repetir un resultado anterior | Las entradas no se guardaron | Almacena prompt, configuración, referencias y URLs de salida. |
Fuentes
- Google Cloud: Parámetros de la API de generación de video Veo
- Google: Actualización de Veo 3.1 Ingredientes a Video
- ByteDance Seed: Lanzamiento oficial de Seedance 2.0