Retour à Encyclopédie de l’IA
Qu’est-ce que la température et le top-p ? Pourquoi les réponses de l’IA fluctuent-elles ?

Qu’est-ce que la température et le top-p ? Pourquoi les réponses de l’IA fluctuent-elles ?

Encyclopédie de l’IA Admin 69 vues

Temperature et Top-p contrôlent tous deux le « comment choisir le mot suivant » du modèle. Pour faire simple, ils influencent la conservation et la divergence des réponses. Plus la température est basse, plus le modèle tend à choisir le mot le plus stable ; Plus la température est élevée, plus le modèle ose expérimenter différentes expressions. Le filtre Top-p selon « quels mots candidats conserver ».

Ces deux paramètres sont souvent soulevés ensemble car ils régulent tous deux l’aléatoire au moment de la génération. Vous voyez que l’IA est parfois stable et parfois nerveuse, et cela tient beaucoup à eux. La basse température est plus adaptée pour la synthèse, l’extraction d’informations et la sortie au format fixe ; Les températures élevées sont plus propices à la créativité, à l’inspiration et à l’écriture ouverte.

Ce sont plutôt des boutons de style

ParamètresQuand il est basQuand il est élevé
TempératurePlus stable, plus conservateur, et plus proche des réponses standardPlus divergents, plus changeants, et plus faciles à exprimer de nouvelles façons
Top-pSeul un petit groupe de candidats à haute probabilité est conservéRetenir plus de candidats et avoir plus de marge d’expression

Beaucoup de gens demanderont : est-il plus intelligent de répondre en montant les deux ? Non. Ils ajustent non pas l’intelligence, mais la distribution des résultats. Le modèle lui-même ne devient pas plus fort à cause de cela, mais devient seulement plus conservateur ou plus libre. De manière générale, une basse température avec un top-p plus conservateur convient à une sortie stable ; Quand vous voulez être plus créatif, lâchez prise progressivement. Pour la plupart des séances de questions-réponses quotidiennes, il est généralement plus pratique de les refuser d’abord que de poursuivre aveuglément la divergence.

Comment la comprendre réellement

  • Lors de la réalisation de résumés, de tableaux et de classifications, vous souhaitez généralement que les réponses soient stables et que les paramètres ne soient pas trop agressifs.
  • Faire du brain breaking, des titres, de la rédaction publicitaire et des paramètres de personnages peut permettre une plus grande divergence.
  • Si vous constatez que les réponses commencent à circuler, ne blâmez pas le modèle et vérifiez si l’aléatoire est trop élevé.

Résumé : Température et Top-p ne sont pas des boutons pour « rendre l’IA plus intelligente », mais des régulateurs pour « rendre l’IA plus stable ou plus divergente ».

Outils Recommandés

Plus