Nano Banana Tutorial: Bearbeiten komplexer Szenen in natürlicher Sprache
Kurzbeschreibung: Dieses Tutorial konzentriert sich auf KI- und Nano Banana-Hotspots und zeigt Ihnen, wie Sie mit natürlicher Sprache komplexe Szenenbearbeitung in Gemini durchführen können: Ersetzen von Hintergründen, Mischen mehrerer Motive, Anpassen von Licht, Schatten und Perspektive. Generieren Sie hochwertige Eingabeaufforderungen mit ChatGPT und Claude und machen Sie KI-Workflows intelligenter, automatisierter und replizierbarer.
1. Übersicht über den Arbeitsablauf
1. Eingang und Materialvorbereitung
Die KI-Bearbeitung beginnt mit der Auswahl von Nano Banana, dem Aufrufen des Bildbearbeitungsmodus und dem Importieren eines klaren Körperbildes und eines Referenzhintergrunds. Verwenden Sie ChatGPT oder Claude, um Szenario-Schlüsselwörter und Stilwörter zu generieren, um sicherzustellen, dass das große Modell die Ziele und Grenzen versteht, und erstellen Sie eine intelligente und automatisierte KI-Toolkette.
2. Prinzipien der Bearbeitung natürlicher Sprache
Anweisungen für künstliche Intelligenz sollten spezifisch und überprüfbar sein: Erklären Sie, dass das Motiv unverändert bleibt, ersetzen Sie nur den Hintergrund, behalten Sie den Hautton bei und die Kleidung stimmt mit der Größe überein. Mit Hilfe von ChatGPT und der Ausgabe von Claude in drei bis fünf Versionen wurde Nano Banana mehrfach getestet, um die stabilsten Ergebnisse des maschinellen Lernens zu erzielen.
(1) Eingabeaufforderungsstrukturvorlage
:Betreffbeschreibung + Handlungsanforderungen + Hintergrundstil + Licht- und Schattenrichtung + Einschränkungen. Beispielaussage: Behalten Sie die Details der Charaktere und der Kleidung bei, ändern Sie den Hintergrund in eine bewölkte Straßenszene in der Stadt, das Licht kommt von links hinten, die Gesamtfarbtemperatur ist kalt und es ist verboten, Gesichtszüge zu verändern.
(2) Konsistenz und Sicherheit
Komplexe Szenen müssen die Konsistenz der Charaktere, die Brennweite des Objektivs und die Tiefenschärfe betonen. Die KI fügt den generierten Inhalten ein Wasserzeichen hinzu, das für die Verwendung in mehreren Szenarien wie E-Commerce, Kurzvideos und sozialen Medien geeignet ist.
2. Vier-Schritte-Methode für komplexe Szenen
1. Trennen Sie das Motiv von der "Greenscreen-Transfermethode"
Bevor der Hintergrund ausgetauscht wird, ändert das KI-Tool zunächst den Hintergrund in reines Grün oder reines Grau und wechselt dann im zweiten Schritt zum Zielhintergrund, wodurch das Verschütten von Farbe und das Eindringen von Schimmel reduziert werden können. In diesem Schritt gibt ChatGPT oder Claude standardisierte Eingabeaufforderungsvorlagen an, und Nano Banana führt die automatisierte Verarbeitung durch.
2. Licht- und Schatten- und Farbabstimmung
Schreiben Sie die Richtung, Intensität und den Weißabgleich der Lichtquelle in die Eingabeaufforderung, z. B. kaltes Licht hinten rechts, bilden Sie ein wenig Umgebungsreflexion und verlangen Sie Schattenweichmacher und Halbschattenübergänge, um sicherzustellen, dass die Synthese der künstlichen Intelligenz nicht verletzt wird.
3. Einheitliche Perspektive und Schärfentiefe
Beschreiben Sie das Kameragefühl: Weitwinkel oder mittlerer Fokus, klare Vorder- und Hintergrundunschärfe, Hintergrund-Bokeh-Radius. Lassen Sie die KI die Horizonthöhe konstant halten und vermeiden Sie, dass die Sohlen der Figuren "schweben".
4. Stil und Charge
Erstellen Sie eineListe von Stilwörtern: Filmgraublau, Filmkorn, kommerzieller Minimalismus, nordisches Zuhause. ChatGPT und Claude generieren zehn bis zwanzig Szenenkombinationen in Chargen, und Nano Banana zykliert mit einem Klick zu einer stabilen automatisierten Produktionslinie.
3. Praktische Beispiele: drei Arten typischer Szenarien
1. KI-Anforderungen an die E-Commerce-Produktkarte
: Ersetzen Sie nur den Hintergrund durch weiche, helle Volltonfarben, fügen Sie leichte Reflexionen und weiche Projektionen hinzu und sperren Sie Produktfarben und Metallmarkierungen. ChatGPT gibt fünf Hintergründe in Markenfarbe aus, Claude bietet Beleuchtungslösungen an und Nano Banana ist ein Film.
2. KI-Anforderungen für Gruppenfotos mit mehreren Charakteren
: Behalten Sie die Position und das Höhenverhältnis der drei Personen links, in der Mitte und rechts bei und ersetzen Sie sie durch den Strand in der Dämmerung, das Licht kommt von rechts, die Farbe der Kleidung bleibt unverändert und die Hautstruktur bleibt erhalten. Bei Bedarf wird es in zwei Runden unterteilt: Zuerst ist der Hintergrund rein grün, und dann wird es an die Küste eingeführt.
3. KI-Anforderungen fürNachtszenen im Hochformat bis in die Stadt
: Fügen Sie Neonreflexionen, warme Farbtemperatur von Straßenlaternen, blaues und violettes Fülllicht am Rand des Motivs und Schärfentiefe im Stil f/2.0 hinzu. Es wird betont, dass es verboten ist, die Struktur der Gesichtszüge und die Haardichte zu verändern und das "Neuzeichnen des Gesichts" zu vermeiden.
4. Qualitätskontrolle und Liste zur Vermeidung von Kernlöchern
1. Anweisungen für Kanten und Haarfäden
fügen Kantenveredelung, Farbentfernung und Haarrekonstruktion hinzu. Wenn Grate auftreten, iterieren Sie in kleinen Schritten, um das gleiche Cue-Skelett beizubehalten.
2. Farbe und Rauschen
Schreiben Sie einen gleichmäßigen Weißabgleich, eine leicht sichtbare Körnung und eine Rauschunterdrückung, um Details zu gewährleisten. Vergleichen Sie den Hautton des exportierten Bildes mit dem Originalbild, um die Konsistenz der KI zu gewährleisten.
(1) Korrektur des Fehlerbeispiels
"Ersetzen Sie den Hintergrund der Nachtszene in der Stadt" wurde geändert in "Nur den Hintergrund der Nachtszene in der Stadt ersetzen, das Motiv ist gesperrt, das hintere rechte ist warm und die Farbe und Hautfarbe der Kleidung wird beibehalten", um die Fehler zu reduzieren.
(2) Batch-Konsistenz
Verwenden Sie feste Vorlagen + variable Bits: Ort, Zeit, Wetter. Variablentabellen werden von ChatGPT und Claude generiert, und Nano Banana läuft in Batches, um konsistente Stile auszugeben.
(3) In den Exportspezifikationen
sind die Auflösung, die Pixel mit langer Kante und das Komprimierungsverhältnis angegeben, und die Quelldatei und das Eingabeaufforderungsprotokoll werden beibehalten, um die Rückverfolgung und Reproduktion zu erleichtern.
Häufig gestellte Fragen (Q&A)
F: Wie teilen Nano Banana und ChatGPT und Claude die effizienteste Arbeit beim Bearbeiten komplexer KI-Szenen auf?
A: Nano Banana ist für die Bildgenerierung und -bearbeitung verantwortlich, während ChatGPT und Claude für das Prompt-Design, den Stilthesaurus und die variablen Tabellen verantwortlich sind, die alle zu einem intelligenten und automatisierten Workflow mit höherer Stabilität und Konsistenz verbunden sind.
F: Wie sollte KI den Hintergrund mit natürlicher Sprache korrigieren, um den Hintergrund zu ersetzen?
A: Verwenden Sie den Greenscreen, um zuerst den Zielhintergrund zu übertragen und dann zu importieren. Fügen Sie Kantenverfeinerung und Farbentfernung hinzu und halten Sie die Proportionen in der Eingabeaufforderung konsistent mit der Perspektive, sodass die Nano-Banane allmählich konvergiert.
F: Wie verwende ich ChatGPT und Claude, um mit Nano Banana für E-Commerce-Batch-Diagramme zu arbeiten?
A: ChatGPT generiert Produktverkaufsargumente und Markenfarblisten, Claude generiert Beleuchtungs- und Szenenparameter und Nano Banana liest Vorlagen aus, um Hintergründe sowie Licht und Schatten in Stapeln zu ersetzen, und exportiert KI-Atlanten im einheitlichen Stil.
F: Was sind die Vorteile und Grenzen von KI-Tools im Vergleich zu herkömmlichen PS-Ausschnitten?
A: Künstliche Intelligenz ist schneller in Bezug auf das semantische Verständnis mehrerer Themen, die Konsistenz von Licht und Schatten und die Einheit des Stils, aber sie muss immer noch klar eingeschränkt und überprüft werden. Nano Banana kombiniert ChatGPT und Claude, um die Effizienz in Massenproduktionslinien deutlich zu verbessern.