Das Qwen-Team hat Qwen-Image-Edit-2509 veröffentlicht, eine monatliche Neugestaltung von Qwen-Image-Edit, die sich auf die Bearbeitung mehrerer Bilder und die Konsistenz einzelner Bilder konzentriert. Im Mehrbildmodus können Benutzer bis zu 1–3 Referenzbilder, z. B. „Person + Produkt“ oder „Person + Szene“, einfügen, um die Konsistenz von Motiv und Material während der Modellsynthese zu wahren und Fehlausrichtungen und ein „zusammengenähtes“ Gefühl zu minimieren. Bei der Einzelbildbearbeitung behalten Gesichter über Posen und Stile hinweg ihre Identität, während Produkte in Anzeigen und Postern ihre wichtigsten Merkmale behalten. Die Textbearbeitung ermöglicht es Benutzern, Inhalte, Schriftarten, Farben und Texturen gleichzeitig zu ändern und unterstützt das Layout langer Texte sowie die Integration von Text und Bildern.
Diese Version unterstützt nativ ControlNet-bedingte Eingaben (Tiefe, Kanten, Keypoints usw.) und erleichtert so den Posenaustausch und die strukturelle Ausrichtung. Offizielle Online-Erfahrungen und Open-Source-Ressourcen stehen zur Verfügung, darunter ein QwenChat-Bildbearbeitungsportal, das Hugging Face-Modell und die Demo, GitHub-Anweisungen und ein ModelScope-Bild. Außerdem haben Community-Diskussionen zur GGUF-Quantisierung und ComfyUI-Anpassung begonnen. Informationen zu spezifischen Funktionen und Best Practices finden Sie in der offiziellen Dokumentation und im Repository.
Häufig gestellte Fragen
F: Was sind die wichtigsten Verbesserungen im Vergleich zur vorherigen Version?
A: Bearbeitung mehrerer Bilder hinzugefügt; deutlich verbesserte Konsistenz zwischen Zeichen und Produkten in einem einzelnen Bild; Textbearbeitung unterstützt Feinsteuerung von Schriftarten/Farben/Materialien usw.
F: Was ist die empfohlene Eingabemenge für die Bearbeitung mehrerer Bilder?
A: Derzeit sind 1–3 Fotos am besten und Kombinationen wie „Personen + Personen/Personen + Produkte/Personen + Szenarien“ werden unterstützt.
F: Ist ControlNet integriert?
A: Ja, es unterstützt nativ bedingte Eingaben wie Tiefe, Kanten und Schlüsselpunkte zur Haltungs- und Strukturkontrolle.
F: Wo kann ich das Modell erleben und erhalten?
A: Sie können das Bildbearbeitungsportal in QwenChat verwenden; GitHub/Hugging Face/ModelScope bieten Gewichte, Beispiele und Online-Demos.
F: Ist das Open Source?
A: Modellgewichte und Beispielcodes werden bereitgestellt. Die Community hat bereits Quantifizierung und Workflow-Anpassung implementiert. Informationen zur spezifischen Autorisierung und Nutzung finden Sie auf den Plattformseiten.