L’équipe Qwen a officiellement lancé le modèle d’édition d’image Qwen-Image-Edit-2511, qui constitue une mise à niveau importante par rapport à la version 2509, qui a permis d’apporter des améliorations significatives dans le contrôle de la cohérence et le montage d’images de scènes réelles. Selon l’introduction officielle, la nouvelle version se concentre sur la résolution de problèmes tels que les images instables des personnages et la dérive d’identité après le montage dans des scènes à plusieurs personnes, et convient à des besoins de montage plus complexes et réalistes.
Au niveau fonctionnel, la version 2511 renforce la cohérence de plusieurs personnes dans les photos de groupe et les scènes complexes, et dispose de capacités LoRA intégrées couramment utilisées dans la communauté, qui peuvent être utilisées directement sans ajustements fins. Parallèlement, le modèle présente de meilleures performances en conception industrielle et en génération de conceptions produit, et sa compréhension des lignes structurelles, des relations structurelles et de la logique géométrique a également été améliorée, ce qui favorise l’exécution de tâches d’ingénierie et d’édition de conception plus précises. Les responsables soulignent que cette version présente des améliorations significatives pour le maintien de l’identité des personnages, des caractéristiques et la stabilité structurelle globale, la rendant adaptée au montage de portraits, à la fusion multi-personnages et aux flux de travail professionnels de conception.
FAQ
Q : Quel type de modèle est Qwen-Image-Edit-2511 ?
R : Il s’agit d’un modèle multimodal pour le retouchage d’images, qui permet la modification et la reconstruction à haute cohérence des images existantes.
Q : Quelles sont les principales améliorations de la version 2511 par rapport à la version 2509 ?
R : Cela améliore principalement la cohérence multi-personnes, la conservation de l’identité, les capacités de génération de conception industrielle et produit, ainsi que la compréhension des structures géométriques.
Q : Qwen-Image-Edit-2511 nécessite-t-il un réglage fin supplémentaire de la LoRA ?
R : Non, le modèle intègre une variété de capacités LoRA couramment utilisées dans la communauté et peut être utilisé directement.
Q : Pour quels scénarios d’application ce modèle convient-il ?
R : Il convient à la révision de portraits, au compositing multi-caractères, à la retouche de scènes réelles, ainsi qu’aux tâches liées à l’ingénierie et à la conception produit.
Q : Où les utilisateurs réguliers peuvent-ils expérimenter le modèle ?
R : Vous pouvez directement expérimenter les capacités du modèle grâce à la fonction d’édition d’images dans Qwen Chat.