Tutoriel Nano Banana : Édition de scènes complexes en langage naturel
Brève description : Ce tutoriel se concentre sur l’IA et les points chauds Nano Banana, vous apprenant à utiliser le langage naturel pour effectuer l’édition de scènes complexes dans Gemini : remplacement des arrière-plans, fusion de plusieurs sujets, correspondance de la lumière, de l’ombre et de la perspective. Générez des invites de haute qualité avec ChatGPT et Claude, ce qui rend les flux de travail de l’IA plus intelligents, automatisés et reproductibles.
1. Vue d’ensemble du flux de travail
1. L’édition de l’IA d’entrée et de préparation des matériaux
commence par la sélection de Nano Banana, l’entrée dans le mode d’édition d’image et l’importation d’une image de corps claire et d’un arrière-plan de référence. Utilisez ChatGPT ou Claude pour générer des mots-clés de scénario et des mots de style afin de vous assurer que le grand modèle comprend les objectifs et les limites, et créez une chaîne d’outils d’IA intelligente et automatisée.
2. Principes d’édition en langage naturel
Les instructions de l’intelligence artificielle doivent être spécifiques et vérifiables : expliquez que le sujet reste inchangé, remplacez uniquement l’arrière-plan, conservez le teint de la peau et les vêtements sont cohérents avec la taille. Avec l’aide de ChatGPT et de Claude qui produit trois à cinq versions, Nano Banana a été testé à plusieurs reprises pour converger vers les résultats d’apprentissage automatique les plus stables.
(1) Modèle de structure d’invite Description du
sujet + Exigences d’action + Style d’arrière-plan + Direction de la lumière et de l’ombre + Restrictions. Exemple d’énoncé : Conservez les détails des personnages et des vêtements, changez l’arrière-plan pour une scène de rue nuageuse de la ville, la lumière provient de l’arrière gauche, la température de couleur globale est froide et il est interdit de changer les traits du visage.
(2) Cohérence et sécurité
Les scènes complexes doivent mettre l’accent sur la cohérence des personnages, la distance focale de l’objectif et la profondeur de champ. L’IA ajoutera un filigrane au contenu généré, qui peut être utilisé dans plusieurs scénarios tels que le commerce électronique, les courtes vidéos et les médias sociaux.
2. Méthode en quatre étapes pour les scènes complexes
1. Séparez le sujet de la « méthode de transfert d’écran vert » Avant de
remplacer l’arrière-plan, l’outil AI change d’abord l’arrière-plan en vert pur ou en gris pur, puis passe à l’arrière-plan cible dans la deuxième étape, ce qui peut réduire le débordement de couleur et la pénétration du moule. Dans cette étape, ChatGPT ou Claude donne des modèles d’invites standardisés, et Nano Banana effectue un traitement automatisé.
2. Correspondance de la lumière et de l’ombre et des couleurs
Écrivez la direction, l’intensité et la balance des blancs de la source lumineuse dans l’invite, comme la lumière froide à l’arrière droit, compensez un peu la réflexion ambiante et nécessitent un adoucissement des ombres et des transitions de pénombre pour s’assurer que la synthèse de l’intelligence artificielle ne viole pas.
3. Perspective et profondeur de champ unifiées
Décrivez la sensation de l’appareil photo : grand angle ou mise au point moyenne, flou clair au premier plan et en arrière-plan, rayon bokeh d’arrière-plan. Laissez l’IA garder la hauteur de l’horizon cohérente et éviter que les semelles des personnages ne « flottent ».
4. Style et lot
Faites uneliste de mots de style : film gris bleu, grain de film, minimalisme commercial, maison nordique. ChatGPT et Claude génèrent dix à vingt combinaisons de scènes par lots, et Nano Banana cycle en un clic pour former une ligne de production automatisée stable.
3. Exemples pratiques : trois types de scénarios typiques 1. Exigences de l’IA
de la carte de produit du commerce électronique
: remplacez uniquement l’arrière-plan par des couleurs unies douces et claires, ajoutez de légers reflets de comptoir et des projections douces, et verrouillez les couleurs du produit et les reflets métalliques. ChatGPT produit cinq arrière-plans de couleur de marque, Claude fournit des solutions d’éclairage et Nano Banana est un film.
2. Exigences de l’IA dela photo de groupe multi-personnages
: conservez la position et le rapport de taille des trois personnes à gauche, au milieu et à droite, et remplacez-le par la plage au crépuscule, la lumière vient de la droite, la couleur des vêtements reste inchangée et la texture de la peau est conservée. Si nécessaire, il est divisé en deux tours : d’abord le fond est vert pur, puis il est introduit au bord de la mer.
3. Portrait à la scène de nuit de la ville
Exigences AI : ajoutez la réflexion du néon, la température de couleur chaude des lampadaires, la lumière d’appoint bleue et violette sur le bord du sujet et la profondeur de champ de style f/2.0. Il est souligné qu’il est interdit de modifier la structure des traits du visage et la densité des cheveux, et d’éviter de « redessiner le visage ».
4. Contrôle de la qualité et liste d’évitement des fosses
1. Les instructions de bord et de fil de cheveux
ajoutent la finition des bords, l’élimination de la couleur et la reconstruction des cheveux. Lorsque des bavures apparaissent, itérez par petites étapes pour maintenir le même squelette de queue.
2. Couleur et bruit
Écrivez une balance des blancs uniforme, un grain légèrement visible, une réduction du bruit pour garantir les détails. Comparez le teint de peau de l’image exportée avec l’image d’origine pour garantir la cohérence de l’IA.
(1) Correction de l’exemple de défaillance
Changement de « Remplacer l’arrière-plan de la scène de nuit de la ville » en « Remplacer uniquement l’arrière-plan de la scène de nuit de la ville, le sujet est verrouillé, l’arrière droit est chaud, et la couleur et la couleur de la peau des vêtements sont conservées » pour réduire les erreurs.
(2) Cohérence des lots
Utilisez des modèles fixes + bits variables : lieu, heure, météo. Les tables variables sont générées par ChatGPT et Claude, et Nano Banana s’exécute par lots pour produire des styles cohérents.
(3) Les spécifications d’exportation
indiquent la résolution, les pixels à bords longs et le taux de compression, et conservent le fichier source et le journal des invites pour faciliter le retour en arrière et la reproduction.
Foire aux questions Q :
Comment Nano Banana et ChatGPT et Claude se répartissent-ils le travail le plus efficace lors de l’édition de scènes d’IA complexes ?
R : Nano Banana est responsable de la génération et de l’édition d’images, tandis que ChatGPT et Claude sont responsables de la conception rapide, du thésaurus de style et des tables de variables, qui sont tous connectés dans un flux de travail intelligent et automatisé avec une stabilité et une cohérence supérieures.
Q : Comment l’IA doit-elle corriger l’arrière-plan avec un langage naturel pour remplacer l’arrière-plan ?
R : Utilisez l’écran vert pour transférer d’abord, puis importez l’arrière-plan cible ; Ajoutez un affinement des bords, une suppression des couleurs et conservez des proportions cohérentes avec la perspective dans l’invite, de sorte que la Nano Banana converge progressivement.
Q : Comment utiliser ChatGPT et Claude pour travailler avec Nano Banana pour les graphiques de lots de commerce électronique ?
R : ChatGPT génère des arguments de vente de produits et des listes de couleurs de marque, Claude génère des paramètres d’éclairage et de scène, et Nano Banana lit des modèles pour remplacer les arrière-plans, la lumière et les ombres par lots, en exportant des atlas d’IA de style unifié.
Q : Quels sont les avantages et les limites des outils d’IA par rapport aux découpes PS traditionnelles ?
R : L’intelligence artificielle est plus rapide en termes de compréhension sémantique multi-sujets, de cohérence des ombres et des lumières et d’unité de style, mais elle doit toujours être clairement contrainte et inspectée. Nano Banana combine ChatGPT et Claude pour améliorer considérablement l’efficacité des lignes de production de masse.