Rollsteg-Gen-4-Charaktere sind alt und veränderbar, was in der Regel nicht mit einem einzigen Prompt gelöst werden kann. Seine Referenzkartenfunktion eignet sich, um die Konsistenz von Charakteren, Szenen und Objekten zu verbessern, aber nur, wenn das Referenzbild sauber genug ist, der Prompttext die Identitätsmerkmale nicht wiederholt ändert und die Linse vernünftig zerlegt ist. Wenn du den Charakter stabilisieren willst, setze "Referenzbildqualität" vor die Eingabeaufforderung.
Wie man ein Referenzbild auswählt
Ich bevorzuge Bilder mit klaren Gesichtern, gleichmäßiger Beleuchtung, ohne Hindernisse und ohne übertriebene Filter. Verwende keine mehreren Fotos, niedrigauflösenden Screenshots, starken Gesichtsausdrücken, halben Gesichtern oder komplexen Hintergründen. Das Modell muss die Identitätsmerkmale aus dem Bild erfassen, und je chaotischer das Referenzbild ist, desto leichter ist es, das Gesicht später zu verändern.
Wenn die Figur feste Kostüme, Frisuren und Requisiten hat, ist es am besten, eine Mehrblick-Ansicht derselben Figur zu erstellen, aber der Stil sollte derselbe bleiben. Mischen Sie nicht eine realistische, eine Anime und eine starke Schönheit, die das Model zwischen Identität und Stil schwanken lässt.
Wie man Prompts schreibt
Beschreibe nicht in jeder Einstellung eine Reihe von Gesichtszügen neu. Wenn zum Beispiel im ersten Absatz "junge Frau, kurze Haare, rundes Gesicht" steht und im zweiten Absatz "reife Frau, lange lockige Haare, spitzes Kinn", wird das Model denken, dass du die Rolle wechselst.
Eine stabilere Art zu schreiben ist, einen einheitlichen Titel zu verwenden, wie zum Beispiel "dieselbe Frau aus dem Referenzbild", und dann nur die Handlung, die Umgebung und die Einstellung zu beschreiben: umdrehen, in den Raum gehen, aus dem Fenster schauen, Nahaufnahme, Seitenlicht. Die Identitätsinformationen werden an die Referenzkarte weitergegeben, und die Objektivinformationen an die Eingabeaufforderung.
Schreib nicht zu lange Aufnahmen
Die Konsistenz der Charaktere hat vor allem Angst davor, dass zu viele Dinge gleichzeitig in einem Clip passieren: Szenen wechseln, Kleidung wechseln, sich umdrehen, rennen, von entfernten Aufnahmen zu Nahaufnahmen und Requisiten aufheben. Wenn man ein komplexes Video in mehrere kurze Einstellungen aufteilt, wird jede Einstellung nur eine Aktion abgeschlossen und dann durch Schnitt die Stabilität deutlich höher gemacht.
Wenn dieselbe Figur mehrere Szenen umfassen muss, erstellt Herr eine Gruppe von Charakter-Make-up-Zeichnungen und verwendet diese als nachfolgende Referenzen. Nimm nicht jedes Mal ein verschwommenes Bild eines Videos und dehne weiter aus.
Wann du deine Erwartungen senken solltest
Das Referenzbild von KI-Videos ist keine traditionelle 3D-Charakterbindung und kann nicht garantieren, dass jeder Frame demselben Schauspieler ähnelt. Für Szenarien wie kommerzielle Werbung, Serienfiguren und Markenhinweise muss die Zeit für manuelles Screening, Regeneration und Nachbearbeitung des Gesichts eingehalten werden. Gen-4 kann die Konsistenz deutlich verbessern, aber betrachte es nicht als ein kostenfreies, kontinuierliches Rollensystem.