Qwenチームは公式に画像編集モデル 「Qwen-Image-Edit-2511」を発表しました。これはバージョン2509への重要なアップグレードであり、整合性制御と実際のシーン画像編集において大きな改善を実現しています。 公式紹介によると、新バージョンは複数人シーンでの編集後の不安定なキャラクター画像やアイデンティティの漂流などの問題の解決に焦点を当てており、より複雑でリアルな編集ニーズに適しています。
機能面では、バージョン2511はグループ写真や複雑なシーンで複数人の一貫性を強化し、コミュニティで一般的に使われているLoRA機能が内蔵されており、追加の微調整なしで直接利用できます。 同時に、モデルは工業デザインや製品デザイン生成においてより優れた性能を持ち、構造線、構造関係、幾何学的論理の理解も向上しており、より正確なエンジニアリングおよびデザイン編集作業の完了に寄与しています。 関係者は、このバージョンがキャラクターのアイデンティティ、キャラクターの特徴、全体的な構造的安定性の維持に大きな改善をもたらし、ポートレート編集、複数キャラクターの融合、プロフェッショナルなデザインワークフローに適していますと強調しています。
よくある質問
Q: Qwen-Image-Edit-2511はどのようなモデルですか?
A: これは画像編集のためのマルチモーダルモデルで、既存画像の高整合性の修正と再構築をサポートします。
Q: バージョン2511と2509版と比べての主な改善点は何ですか?
A: 主に複数人間の一貫性、アイデンティティ保持、産業および製品デザインの生成能力、幾何学的構造の理解を向上させます。
Q: Qwen-Image-Edit-2511は追加のLoRAファインチューニングが必要ですか?
A: いいえ、このモデルにはコミュニティで一般的に使われているさまざまなLoRA機能が内蔵されており、直接使用可能です。
Q: このモデルはどのような応用シナリオに適していますか?
A: ポートレート保持編集、マルチキャラクター合成、実世界のシーンレタッチ、エンジニアリングや製品設計関連の作業に適しています。
Q: 一般ユーザーはどこでモデルを体験できますか?
A: Qwen Chatの画像編集機能を通じてモデルの機能を直接体験できます。