Midjourneyの参考画像とは異なり、スタイル参照は通常「この画像をコピーする」ために使われます。 「--sref」は主に色彩、質感、光、媒体などのスタイルを借用しており、キャラクターやオブジェクト、構図の厳密な再現には責任を負いません。 より似たような結果を望むなら、まずスタイルの一貫性、キャラクターの統一性、構成の近さを区別してください。
三つの参考図を混ぜてはいけません
画像の気質を統一したい場合は、Style Reference(--sref)を使ってください。 ポスター、アバター、イラストの統一スタイルを作るには適していますが、「同じ人物、同じ服装、同じポーズ」を求めるには適していません。
参照画像の主題や構成を画像に表示したい場合は、画像プロンプトを使い、生成したい内容をテキストプロンプトで説明してください。 「このスタイルをコピーして犬にする」といった命令文の説明を書く代わりに、「犬の詳細な肖像画」のようにターゲット画面を直接描写してください。
人やペルソナ、ブランド要素を一貫させたいなら、単に「--sref」ではなく、キャラクターリファレンスやオムニリファレンスのようなエントリーを使う必要があります。 スタイルイメージはアイデンティティイメージとは異なります。
より安定させるためのチューニング方法
最初のステップは、矛盾する言葉を減らすことです。 参考画像はすでに透明な油絵の質感を持っているので、「サイバーパンク、映画、3Dレンダリング、リアル写真」といった要素をプロンプトに重ねてはいけません。 スタイルの言葉が矛盾すればするほど、参考図は薄まってしまいます。
次のステップは「--sw」を調整することです。 値が高いほど、スタイル参照の影響は強くなります。 低すぎると通常のプロンプトのようになり、高すぎると主題の説明が犠牲になることがあります。 まずはデフォルト値の近くで試してみて、徐々に増やしていきます。
第三のステップは、きれいな参考図を使うことです。 複雑なコラージュやテキスト、複数の人物が混ざり合ったもの、そして被写体が小さすぎる画像は、モデルに何を学べばいいのか分からなくさせます。 クリアなスタイルで安定した照明、明らかな透かしがない単一の画像を選ぶのが最善です。
踏みやすい穴
「--sref」が顔を覚えているとは期待せず、全く異なるスタイルの写真を無理にまとめるのは避けましょう。 マルチリファレンス図はスタイルを混ぜることもありますが、互いに打ち消し合うこともあります。
「同じ集合だが完全に重複していない」を望むなら、「--sref」が適切です。 「同じキャラクターが連続して登場する」という設定を追求しているなら、キャラクター/主題のリファレンスを使い、衣装や髪型、小道具はもっと明確に書くべきです。