DeepSeek 发布 V3.2、V3.2-Speciale：推理优先模型面向 Agent 场景

AI资讯 • Admin • 2025/12/1 • 214 次浏览

两个月前，DeepSeek 发布实验性模型 V3.2-Exp，并通过用户回访确认其在各类场景中不逊于 V3.1-Terminus，验证了 DSA 稀疏注意力机制的有效性。最新发布的正式版 DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale 现已亮相，其中 V3.2 已在官网网页端、App 与 API 全面替换 V3.2-Exp，成为默认服务模型；Speciale 版本则以临时 API 服务形式开放，用于社区评测与研究。

官方称，V3.2 的目标是在推理能力与输出长度之间取得平衡，适合问答和通用 Agent 等日常场景，在公开推理 Benchmark 上达到 GPT-5 水平，仅略低于 Gemini-3.0-Pro，且相较 Kimi-K2-Thinking 在输出长度和计算开销上更为节制。V3.2-Speciale 则在长思考能力上大幅增强，并融合 DeepSeek-Math-V2 的定理证明能力，在 IMO、CMO、ICPC 世界总决赛及 IOI 2025 中取得金牌成绩，其中 ICPC、IOI 表现分别接近人类选手第二名与第十名。该模型专攻复杂推理任务，Token 消耗显著更高，目前仅支持思考模式对话，不开放工具调用，最大输出长度为 128K。

在智能体应用方面，DeepSeek-V3.2 成为首个将“思考”直接融入工具调用的模型，既可在思考模式下多轮“思考+调用工具”，也支持非思考模式调用。官方通过合成 1800 余个环境、8.5 万条复杂指令构建大规模 Agent 训练数据，使模型在多种智能体评测中达到当前开源模型的领先水平。V3.2-Speciale 则通过临时端点 base_url 配置访问，预计服务至 2025 年12月15日，北京时间 23:59 截止。

常见问题

Q：DeepSeek-V3.2 和 V3.2-Speciale 的定位有什么不同？

A：V3.2 面向日常问答和通用 Agent，强调推理与成本平衡；V3.2-Speciale 则追求极限推理能力，专注高难数学与编程任务。

Q：现在在网页端和 App 上调用到的是哪个模型？

A：DeepSeek 已将网页端、App 与标准 API 默认模型统一升级为正式版 DeepSeek-V3.2，不再使用 V3.2-Exp。

Q：V3.2-Speciale 如何访问，有哪些限制？

A：需在 API 中设置特定 base_url 才能调用，该版本仅支持思考模式对话、不支持工具调用，最大输出长度为 128K，服务开放到 2025 年12月15日。

Q：“思考模式下的工具调用”具体指什么？

A：指 V3.2 可以在推理过程中多次插入工具调用，再结合工具返回结果继续思考，适合复杂、多步骤的 Agent 任务场景。

Q：两个模型都已经开源了吗？

A：官方已在 HuggingFace 和 ModelScope 发布 V3.2 与 V3.2-Speciale 的开源权重，供社区下载使用，同时配套技术报告与思考模式 API 文档。

DeepSeek 发布 V3.2、V3.2-Speciale：推理优先模型面向 Agent 场景

相关文章

Figure 03 人形机器人是什么？家用通用劳动力一文看懂

DeepSeek-V3.2 发布：稀疏注意力带来的高效推理与通用 Agent 能力

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

DeepSeek 发布 V3.2、V3.2-Speciale：推理优先模型面向 Agent 场景

相关文章

Figure 03 人形机器人是什么？家用通用劳动力一文看懂

DeepSeek-V3.2 发布：稀疏注意力带来的高效推理与通用 Agent 能力

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

提交AI工具

请确认提交信息