温度とTop-pはどちらもモデルの「次の単語の選び方」を制御します。 簡単に言えば、それらは答えの保守的で分岐に関わるのです。 温度が低いほど、モデルは最も安定した単語を選ぶ傾向があります。 温度が高いほど、モデルは異なる表現を試す大胆さが強まります。 Top-pは「どの候補語を保持すべきか」をフィルターします。
これら2つのパラメータは、生成時のランダム性を調節するため、しばしば一緒に上げられます。 AIは安定し、時には神経質で、多くはAIに関係しています。 低温は要約、情報抽出、固定フォーマットの出力により適しています。 高温は創造性やインスピレーション、自由な執筆に適しています。
どちらかというとスタイルノブのようなものです
| パラメータ | 気分が低いときは | 高い時 |
|---|---|---|
| 温度 | より安定していて、より保守的で、より標準的な答えに近い | より発散的で、変化しやすく、新しい表現がしやすい |
| トップp | 高確率の候補者のうち、少数のグループだけが残留します | より多くの候補者を維持し、表現の余地を広げる |
多くの人がこう尋ねるでしょう:両方を音量を上げて答える方が賢明でしょうか? そうではない。 彼らは知能ではなく、出力の分布を調整します。 モデル自体が強くなるわけではなく、むしろより保守的または自由になるだけです。 一般的に、より保守的なトップpの低温が安定した出力に適しています。 もっと創造的になりたいときは、徐々に手放しましょう。 ほとんどの日々のQ&Aでは、盲目的にダイバージェンスを追いかけるよりも、最初に断る方が現実的です。
実際にどう理解すればいいのか
- 要約や表、分類を作成する際は、通常は答えが安定していて、パラメータがあまり厳しくなくていいのが望ましいです。
- ブレインブレイク、タイトル、コピーライティング、キャラクター設定を行うことで、より大きな分岐が生まれます。
- 答えが飛び交い始めたら、モデルのせいにせず、ランダム性が高すぎるかどうか確認してください。
まとめ:温度とTop-pは「AIをより賢くする」ためのボタンではなく、「AIをより安定またはより発散的にする」ためのレギュレーターです。