Lista de Verificación para Imágenes de Referencia en Video con IA: Cómo Obtener Resultados Reutilizables

Omniveo TeamMay 14, 2026

Las imágenes de referencia pueden hacer que la generación de video con IA sea mucho más controlable, pero solo cuando se preparan como activos de producción. Un conjunto de referencias desordenado obliga al modelo a adivinar. Un conjunto limpio le indica al modelo qué preservar, qué animar y qué ignorar.

Esta lista es para creadores, equipos y profesionales de marketing de producto que construyen flujos de trabajo repetibles de imagen a video.

La regla de las cinco referencias

Antes de subir cualquier cosa, etiqueta cada referencia con uno de estos cinco roles:

  1. Identidad: la persona, personaje, mascota o producto que debe mantenerse reconocible.
  2. Geometría: forma, silueta, empaque, diseño o estructura de la habitación.
  3. Material: tela, vidrio, metal, textura de piel, superficie de alimentos o textura de iluminación.
  4. Entorno: ubicación, fondo, clima, hora del día.
  5. Movimiento: una pose, fotograma o clip anterior que sugiera movimiento.

Si una referencia no tiene un rol, elimínala. Más referencias no generan automáticamente más control.

Una entrada limpia supera a un prompt ingenioso

Usa imágenes de referencia que sean:

  • De alta resolución suficiente para mostrar el detalle que te importa.
  • Sin filtros pesados, a menos que el filtro sea el objetivo de estilo.
  • Sin marcas de agua, superposiciones de interfaz ni texto aleatorio.
  • Recortadas alrededor del sujeto importante.
  • Consistentes en iluminación cuando la identidad o precisión del producto sea importante.

Si la etiqueta del producto es diminuta en la foto subida, no esperes que el modelo la preserve. Sube una foto limpia del empaque e indica al modelo qué detalles importan.

Indica cada referencia explícitamente

Mal:

Usa estas referencias para hacer un video de moda genial.

Mejor:

Usa la referencia 1 para el rostro y el atuendo de la modelo. Usa la referencia 2 para la iluminación de estudio y el fondo gris. Usa la referencia 3 solo para la forma del bolso y la textura del cuero. Crea un acercamiento lento de 8 segundos con movimiento sutil de la tela. No cambies el rostro, el color del atuendo ni las proporciones del bolso.

Conserva las entradas exitosas

El mejor flujo de trabajo con referencias no solo depende de la calidad de la subida. También necesita persistencia. Cuando una generación funciona, guarda la configuración completa:

CampoPor qué es importante
PromptCaptura la instrucción creativa.
Modelo y modoTexto a video e imagen a video se comportan de manera diferente.
Relación de aspectoLos planos verticales y horizontales se componen de forma distinta.
DuraciónEl ritmo del movimiento cambia con la duración.
ResoluciónAfecta la calidad final y el costo de créditos.
Configuración de sonidoDetermina si el audio debe ser dirigido.
URLs de referenciaPermite al equipo regenerar o iterar después.
URLs de salidaMantiene el activo generado disponible después de que los enlaces temporales caduquen.

Si estas entradas se almacenan, el historial se convierte en una herramienta de producción en lugar de una galería. Un compañero de equipo puede hacer clic en una generación anterior, recuperar el prompt y las referencias originales, ajustar una variable y generar una variación controlada.

Un flujo de trabajo repetible

Utiliza este ritmo operativo:

  1. Sube solo las referencias que tengan un rol claro.
  2. Escribe un prompt que asigne a cada referencia una tarea.
  3. Genera el primer clip con la configuración más económica aceptable.
  4. Corrige la composición antes de ajustar los detalles.
  5. Guarda la configuración de trabajo antes de aumentar la resolución.
  6. Reutiliza las mismas referencias para variantes en lugar de volver a subir recortes diferentes.

Modos de fallo comunes

FallaCausa probableSolución
El rostro cambia entre tomasLa referencia de identidad es confusa o está mezclada con referencias de estiloUsa un retrato limpio y di "preservar identidad".
La forma del producto cambiaEl prompt pide movimiento que deforma el productoAgrega "mantener proporciones sin cambios" y reduce la acción.
La escena se ve genéricaLa referencia de entorno es débilAñade una referencia de ubicación y describe la hora del día.
El audio se siente aleatorioEl sonido no fue dirigidoNombra ambiente, foley, música y diálogo por separado.
No se puede repetir un resultado anteriorLas entradas no se guardaronAlmacena prompt, configuración, referencias y URLs de salida.

Fuentes

Lista de Verificación para Imágenes de Referencia en Video con IA: Cómo Obtener Resultados Reutilizables | Omniveo