騰訊 Hunyuan は、画像編集用のネイティブマルチモーダルモデルである HunyuanImage 3.0-Instruct をリリースしました。 公式導入部は80Bパラメータと約13Bのアクティベーションパラメータを持つハイブリッドエキスパート(MoE)アーキテクチャを採用しており、ユーザー画像や指示を受け取った後に結果を生成する前にまず理解と推論を行い、命令の整合性と編集安定性の向上を強調しています。
能力レベルでは、「精密編集」と「マルチイメージ融合」に焦点を当てており、追加・削除・修正、スタイル変換、古い写真の復元、複数の画像からキャラクターや要素を抽出して統一されたシーンを合成し、非ターゲットエリアの破壊を防ごうとしています。 製品面では、絵文字、ソーシャルシェアリング、eコマースポスター、バーチャルキャラクター共同制作などのアプリケーションにも関連機能が活用されています。 オンラインエクスペリエンスポータルはPCで利用可能とマークされています。
性能に関しては、公式かつ関連する序文では、画像品質とアラインメント性能は主要なクローズドソースモデルと比較してベンチマークできるとされていますが、異なるタスクやデータ配布における第三者の独立比較の結論は、さらなる公開評価によって裏付けられる必要があります。 画像編集やブレンディング機能を使用する場合、プライバシーや著作権遵守、ポートレートやテキスト内容の誤った改変リスク、生成された結果の一貫性の不確実性に関する懸念が依然として存在します。
よくある質問
Q: HunyuanImage 3.0-Instructはどのようなモデルですか?
A: これは騰訊魂源がリリースした画像から画像への編集および画像編集モデルで、入力画像を生成する前に理解し、理由を考える能力を強調しています。
Q: Tencent Hunyuan Image 3.0は画像生成にどのような編集操作をサポートしていますか?
A: よくあるのは、要素の追加、オブジェクトの削除、スタイルの変更、古い写真の復元、キャラクターやテキストの内容の変更など、そして未編集の領域をできるだけ安定させることです。
Q: HunyuanImage 3.0-Instructのマルチイメージ融合能力は何ですか?
A: 複数の画像から人物や要素を抽出して合成し、一貫したグループ写真や新しいシーン図を作成できます。
Q: HunyuanImage 3.0-Instructのパラメータスケールとアーキテクチャは何ですか?
A: 公開情報によると、これは80BパラメータのMoEアーキテクチャであり、効果と効率の両方を考慮するために約13Bパラメータが推論時に有効化されます。
Q: Mixed Image 3.0を使って画像を生成するリスクは何ですか?
A: プライバシーや著作権の許可、ポートレートやテキストの誤改変の可能性、編集境界や細部の不一致による再編集コストに注意を払う必要があります。