- Blog
- KI-Video-Referenzbild-Checkliste: So erzielen Sie wiederverwendbare Ergebnisse
KI-Video-Referenzbild-Checkliste: So erzielen Sie wiederverwendbare Ergebnisse
Referenzbilder können die KI-Videogenerierung erheblich kontrollierbarer machen – aber nur, wenn sie wie Produktions-Assets vorbereitet sind. Ein unordentlicher Referenzsatz zwingt das Modell zum Raten. Ein sauberer Referenzsatz sagt dem Modell, was es bewahren, was es animieren und was es ignorieren soll.
Diese Checkliste richtet sich an Produktmarketer, Kreative und Teams, die wiederholbare Image-to-Video-Workflows aufbauen.
Die Fünf-Referenzen-Regel
Bevor Sie etwas hochladen, kennzeichnen Sie jede Referenz mit einer von fünf Rollen:
- Identität: Die Person, Figur, das Maskottchen oder Produkt, das erkennbar bleiben muss.
- Geometrie: Form, Silhouette, Verpackung, Layout oder Raumstruktur.
- Material: Stoff, Glas, Metall, Hauttextur, Lebensmitteloberfläche oder Lichttextur.
- Umgebung: Ort, Hintergrund, Wetter, Tageszeit.
- Bewegung: Eine Pose, ein Frame oder ein vorheriger Clip, der Bewegung andeutet.
Wenn eine Referenz keine Rolle hat, entfernen Sie sie. Mehr Referenzen bedeuten nicht automatisch mehr Kontrolle.
Saubere Eingabe schlägt clevere Aufforderungen
Verwenden Sie Referenzbilder, die:
- Hochauflösend genug sind, um die Details zu zeigen, die Ihnen wichtig sind.
- Nicht stark gefiltert sind, es sei denn, der Filter ist das Stilziel.
- Frei von Wasserzeichen, UI-Overlays und zufälligem Text sind.
- Um das wichtige Motiv herum beschnitten sind.
- Eine konsistente Beleuchtung aufweisen, wenn Identität oder Produktgenauigkeit wichtig sind.
Wenn das Produktetikett im hochgeladenen Foto winzig ist, erwarten Sie nicht, dass das Modell es bewahrt. Laden Sie ein sauberes Packshot hoch und sagen Sie dem Modell, welche Details wichtig sind.
Fordern Sie jede Referenz explizit auf
Schlecht:
Verwenden Sie diese Referenzen, um ein cooles Modevideo zu erstellen.
Besser:
Verwenden Sie Referenz 1 für das Gesicht und Outfit des Models. Verwenden Sie Referenz 2 für die Studio-Beleuchtung und den grauen Hintergrund. Verwenden Sie Referenz 3 nur für die Handtaschenform und die Lederstruktur. Erstellen Sie einen 8-sekündigen langsamen Push-In mit subtiler Stoffbewegung. Ändern Sie nicht das Gesicht, die Outfit-Farbe oder die Proportionen der Handtasche.
Erfolgreiche Eingaben bewahren
Der beste Referenz-Workflow hängt nicht nur von der Upload-Qualität ab. Er erfordert auch Beständigkeit. Wenn eine Generierung funktioniert, speichern Sie das vollständige Setup:
| Feld | Warum es wichtig ist |
|---|---|
| Prompt | Erfasst die kreative Anweisung. |
| Modell und Modus | Text-to-Video und Image-to-Video verhalten sich unterschiedlich. |
| Seitenverhältnis | Vertikale und horizontale Aufnahmen komponieren unterschiedlich. |
| Dauer | Das Bewegungstempo ändert sich mit der Länge. |
| Auflösung | Beeinflusst die Endqualität und die Kreditkosten. |
| Toneinstellung | Bestimmt, ob Audio gesteuert werden muss. |
| Referenz-URLs | Ermöglicht dem Team, später neu zu generieren oder zu iterieren. |
| Ausgabe-URLs | Hält das generierte Asset verfügbar, nachdem temporäre Links abgelaufen sind. |
Wenn diese Eingaben gespeichert werden, wird der Verlauf zu einem Produktionswerkzeug statt zu einer Galerie. Ein Teammitglied kann auf eine alte Generierung klicken, den ursprünglichen Prompt und die Referenzen wiederherstellen, eine Variable anpassen und eine kontrollierte Variation generieren.
Ein wiederholbarer Arbeitsablauf
Nutzen Sie diesen Betriebsrhythmus:
- Laden Sie nur die Referenzen hoch, die eine klare Funktion haben.
- Schreiben Sie einen Prompt, der jeder Referenz eine Aufgabe zuweist.
- Generieren Sie den ersten Clip mit der günstigsten akzeptablen Einstellung.
- Beheben Sie die Komposition, bevor Sie Details optimieren.
- Speichern Sie das Arbeitssetup, bevor Sie die Auflösung erhöhen.
- Verwenden Sie dieselben Referenzen für Varianten erneut, anstatt verschiedene Ausschnitte neu hochzuladen.
Häufige Fehlermodi
| Fehler | Wahrscheinliche Ursache | Lösung |
|---|---|---|
| Gesichtsveränderungen zwischen Aufnahmen | Identitätsreferenz ist unklar oder mit Stilreferenzen vermischt | Verwenden Sie ein sauberes Porträt und sagen Sie "Identität bewahren." |
| Produktform ändert sich | Prompt fordert eine Bewegung, die das Produkt verformt | Fügen Sie "Proportionen unverändert lassen" hinzu und reduzieren Sie die Aktion. |
| Szene wirkt generisch | Umgebungsreferenz ist schwach | Fügen Sie eine Ortsreferenz hinzu und beschreiben Sie die Tageszeit. |
| Audio wirkt zufällig | Ton wurde nicht gesteuert | Benennen Sie Atmosphäre, Geräusche, Musik und Dialog getrennt. |
| Wiederholung kann altes Ergebnis nicht erreichen | Eingaben wurden nicht gespeichert | Speichern Sie Prompt, Einstellungen, Referenzen und Ausgabe-URLs. |
Quellen
- Google Cloud: Veo Video-Generierungs-API-Parameter
- Google: Veo 3.1 Ingredients to Video-Update
- ByteDance Seed: Seedance 2.0 Offizieller Start