Temperature 和 Top-p 都是在控制模型“怎么选下一个词”。简单说,它们影响的是回答有多保守、多发散。温度越低,模型越倾向选最稳的词;温度越高,模型越敢尝试不同表达。Top-p 则是在“保留哪些候选词”这件事上做筛选。
这两个参数常被一起提起,因为它们都在调节生成时的随机性。你看到 AI 有时很稳、有时很跳,很大程度上就和它们有关。低温更适合总结、信息抽取和固定格式输出;高温更适合创意、灵感和开放式写作。
它们更像风格旋钮
| 参数 | 偏低时 | 偏高时 |
|---|---|---|
| Temperature | 更稳、更保守、更像标准答案 | 更发散、更有变化、更容易出新表达 |
| Top-p | 只保留更小的一批高概率候选 | 保留更多候选,表达空间更大 |
很多人会问:是不是把这两个都调大,回答就更聪明?不是。它们调的不是智力,而是输出分布。模型本身不会因此变强,只会变得更保守或更自由。一般来说,低 temperature 配合较保守的 top-p,适合稳定输出;想要更有创意时,再逐步放开。对大多数日常问答来说,先把它们调低,通常比一味追求发散更实用。
实际怎么理解
- 做摘要、表格、分类,通常希望答案稳定,参数别太激进。
- 做脑暴、标题、文案、角色设定,可以允许更高的发散度。
- 如果你发现回答开始乱飞,先别怪模型,先看看是不是随机性设得太高。
一句话总结:Temperature 和 Top-p 不是“让 AI 变聪明”的按钮,而是“让 AI 更稳还是更会发散”的调节器。