Temperature 和 Top-p 是什么?为什么 AI 回答会忽稳忽飘
Temperature 和 Top-p 都是在控制模型“怎么选下一个词”。简单说,它们影响的是回答有多保守、多发散。温度越低,模型越倾向选最稳的词;温度越高,模型越敢尝试不同表达。Top-p 则是在“保留哪些候选词”这件事上做筛选。 这两个参数常被一起提起,因为它们都在调节生成时的随机性。你看到 A...
Temperature 和 Top-p 都是在控制模型“怎么选下一个词”。简单说,它们影响的是回答有多保守、多发散。温度越低,模型越倾向选最稳的词;温度越高,模型越敢尝试不同表达。Top-p 则是在“保留哪些候选词”这件事上做筛选。 这两个参数常被一起提起,因为它们都在调节生成时的随机性。你看到 A...
System Prompt 可以理解成“放在更高层的规则”。它不是普通用户随手输入的那句提示词,而是先于对话存在、用来规定模型角色、边界和行为方式的基础指令。很多聊天机器人之所以风格稳定,背后都少不了它。 普通提示词更像临时任务,比如“帮我写一段介绍”。System Prompt 更像长期设定,比如...
Token 可以理解成模型处理文本时的“最小工作单元”。它不一定等于一个字、一个词或者一个标点,更像是模型自己切出来的片段。英文里一个单词可能拆成几个 token,中文里一个短句也可能被拆成多个 token。 这件事看起来抽象,但它直接影响三件最现实的事:你能塞多少内容进去、一次对话会花多少钱、模型...
Transformer 是一种神经网络架构。它之所以重要,不是因为名字响,而是因为它把“并行处理”和“上下文建模”这两件事做得很好。今天你看到的大多数大语言模型,本质上都离不开它或它的变体。 在 Transformer 之前,很多模型更依赖循环结构,一步一步读文本,速度慢,长距离依赖也容易掉链子。T...
注意力机制,简单说就是让模型在处理信息时学会“看重点”。人读一段话时不会平均看每个字,模型也一样:它会根据当前任务,给不同词或片段分配不同权重。权重高的内容更容易影响结果,权重低的内容就像背景噪音。 这也是为什么注意力机制一出现,大模型的效果就明显变了。以前的模型更像按顺序硬读,读到后面经常忘前面;...
AI 浏览器正在成为 2025-2026 年一个非常有流量潜力的新概念。它不再只是传统意义上的网页容器,而是开始把搜索、总结、对话、跨页面理解和多步任务执行整合进浏览器本身。也正因为这种变化,浏览器不再只是“看网页的工具”,而越来越像一个能帮你完成任务的代理入口。 这个方向之所以被反复讨论,是因为浏...