Post-Training 是什么?为什么很多模型真正拉开差距的是后训练

Post-Training 是什么?为什么很多模型真正拉开差距的是后训练

Post-Training 指的是模型在完成大规模预训练之后,继续通过额外训练步骤把它变得更有用、更稳定、更符合目标任务的过程。很多人一提模型强不强,第一反应还是盯预训练数据量和参数规模,但现在业内越来越清楚地看到,真正把“会背知识”变成“能干好活”的,往往就是后训练。 预训练更像打地基,让模型学会...

Admin
31
Grounding 是什么?为什么越来越多 AI 搜索都强调“带来源回答”

Grounding 是什么?为什么越来越多 AI 搜索都强调“带来源回答”

Grounding 一般可以理解成“让模型的回答尽量立在可核实的外部信息上”。它最常见的表现,就是模型在生成答案时结合搜索结果、数据库记录、企业知识库或其他明确来源,并把这些来源一并带回来。最近很多 AI 搜索产品都在强调 grounding,本质上是在回应用户最核心的不满:别只给我像真的答案,我还...

Admin
52
Prompt Caching 是什么?为什么长提示和多轮 Agent 都在想办法吃到缓存

Prompt Caching 是什么?为什么长提示和多轮 Agent 都在想办法吃到缓存

Prompt Caching 指的是把模型请求里那段反复出现的提示前缀缓存下来,后续再遇到同样或高度一致的前缀时,尽量直接复用处理结果,而不是每次都从头算一遍。它这两年之所以越来越热,不是因为名字高级,而是因为越来越多产品终于意识到:固定 system prompt、工具定义、长规则、长文档背景,才...

Admin
53
Agentic Search 是什么?为什么搜索产品开始从“给答案”转向“替你查”

Agentic Search 是什么?为什么搜索产品开始从“给答案”转向“替你查”

Agentic Search 一般指带有“自主查找、拆解任务、连续浏览和整理结果”能力的新一代搜索方式。它和传统搜索最大的不同,不只是把十条链接换成一段总结,而是系统会自己规划搜索步骤、连续翻页面、交叉验证、补问缺口,最后把结果组织成更可用的答案。所以它最近会火,很大程度上是因为用户开始期待搜索工具...

Admin
59
Voice Agent 是什么?为什么 AI 语音助手开始从“会说话”走向“会办事”

Voice Agent 是什么?为什么 AI 语音助手开始从“会说话”走向“会办事”

Voice Agent 可以理解成“以语音为主入口的 Agent”。它不只是把你的话转成文字,再把模型回复念出来,而是把实时听、理解、打断、追问、调用工具、执行任务这些能力放进同一个交互闭环里。所以最近大家讨论 Voice Agent,重点已经不再是语音像不像人,而是它能不能真的替你把事办完。 以前...

Admin
57
Context Caching 是什么?为什么它正在成为长上下文产品的成本关键字

Context Caching 是什么?为什么它正在成为长上下文产品的成本关键字

Context Caching 指的是把一段会被反复发送给模型的上下文先缓存起来,后续请求尽量复用,而不是每次都重新处理一遍。它最近会突然变热,原因非常现实:长上下文产品越来越多,但谁都不想重复为同一大段文档、规则或代码库反复付钱。 这个概念经常被误听成“模型记住了我的全部内容”。其实不是。Cont...

Admin
54

推荐工具

更多