返回AI资讯
DeepSeek 发布 V3.2、V3.2-Speciale:推理优先模型面向 Agent 场景

DeepSeek 发布 V3.2、V3.2-Speciale:推理优先模型面向 Agent 场景

AI资讯 Admin 165 次浏览

两个月前,DeepSeek 发布实验性模型 V3.2-Exp,并通过用户回访确认其在各类场景中不逊于 V3.1-Terminus,验证了 DSA 稀疏注意力机制的有效性。最新发布的正式版 DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale 现已亮相,其中 V3.2 已在官网网页端、App 与 API 全面替换 V3.2-Exp,成为默认服务模型;Speciale 版本则以临时 API 服务形式开放,用于社区评测与研究。

官方称,V3.2 的目标是在推理能力与输出长度之间取得平衡,适合问答和通用 Agent 等日常场景,在公开推理 Benchmark 上达到 GPT-5 水平,仅略低于 Gemini-3.0-Pro,且相较 Kimi-K2-Thinking 在输出长度和计算开销上更为节制。V3.2-Speciale 则在长思考能力上大幅增强,并融合 DeepSeek-Math-V2 的定理证明能力,在 IMO、CMO、ICPC 世界总决赛及 IOI 2025 中取得金牌成绩,其中 ICPC、IOI 表现分别接近人类选手第二名与第十名。该模型专攻复杂推理任务,Token 消耗显著更高,目前仅支持思考模式对话,不开放工具调用,最大输出长度为 128K。

在智能体应用方面,DeepSeek-V3.2 成为首个将“思考”直接融入工具调用的模型,既可在思考模式下多轮“思考+调用工具”,也支持非思考模式调用。官方通过合成 1800 余个环境、8.5 万条复杂指令构建大规模 Agent 训练数据,使模型在多种智能体评测中达到当前开源模型的领先水平。V3.2-Speciale 则通过临时端点 base_url 配置访问,预计服务至 2025 年12月15日,北京时间 23:59 截止。

常见问题

Q:DeepSeek-V3.2 和 V3.2-Speciale 的定位有什么不同?

A:V3.2 面向日常问答和通用 Agent,强调推理与成本平衡;V3.2-Speciale 则追求极限推理能力,专注高难数学与编程任务。

Q:现在在网页端和 App 上调用到的是哪个模型?

A:DeepSeek 已将网页端、App 与标准 API 默认模型统一升级为正式版 DeepSeek-V3.2,不再使用 V3.2-Exp。

Q:V3.2-Speciale 如何访问,有哪些限制?

A:需在 API 中设置特定 base_url 才能调用,该版本仅支持思考模式对话、不支持工具调用,最大输出长度为 128K,服务开放到 2025 年12月15日。

Q:“思考模式下的工具调用”具体指什么?

A:指 V3.2 可以在推理过程中多次插入工具调用,再结合工具返回结果继续思考,适合复杂、多步骤的 Agent 任务场景。

Q:两个模型都已经开源了吗?

A:官方已在 HuggingFace 和 ModelScope 发布 V3.2 与 V3.2-Speciale 的开源权重,供社区下载使用,同时配套技术报告与思考模式 API 文档。

DeepSeekV3.2正式版模型解析 DeepSeekV3.2Speciale长思考 DeepSeekV3.2对标GPT5推理力 DeepSeekV3.2与Gemini3.0Pro对比 DeepSeekV3.2与KimiK2算力差异 DeepSeekV3.2适合通用AIAgent场景 V3.2Speciale高难数学推理神器 V3.2Speciale融合DeepSeekMathV2 DeepSeekV3.2DSA稀疏注意力机制 DeepSeekV3.2多轮思考工具调用 DeepSeekV3.2网页端App全面上线 DeepSeekV3.2API默认服务模型 V3.2Speciale临时端点baseurl说明 V3.2Speciale服务截止时间提醒 DeepSeekV3.2输出长度与成本平衡 V3.2Speciale最大输出长度128K DeepSeekV3.2在公开推理榜单成绩 V3.2SpecialeIMO数学奥赛金牌表现 V3.2Speciale在CMO竞赛中的成绩 V3.2SpecialeICPC世界总决赛水平 V3.2SpecialeIOI2025接近人类前十 DeepSeekV3.2适配复杂多步骤任务 DeepSeekV3.2思考模式对话体验 DeepSeekV3.2非思考模式成本控制 DeepSeekV3.2Agent大规模合成数据 DeepSeekV3.2训练1800环境细节 DeepSeekV3.28.5万复杂指令数据集 DeepSeekV3.2在开源Agent评测领先 V3.2Speciale专攻高难编程题解 DeepSeekV3.2适合日常问答使用 DeepSeekV3.2替代V3.2Exp版本说明 DeepSeekV3.2与V3.1Terminus对比 DeepSeekV3.2Exp用户回访效果反馈 DeepSeekV3.2适合作为公司主力模型 DeepSeekV3.2适配工具调用AIAgent框架 开源DeepSeekV3.2权重下载途径 V3.2Speciale开源模型权重获取 DeepSeekV3.2HuggingFace模型仓库 DeepSeekV3.2ModelScope下载使用 DeepSeekV3.2技术报告与API文档 如何选择DeepSeekV3.2或Speciale DeepSeekV3.2适合哪些开发者场景 Speciale模型Token消耗成本评估 DeepSeekV3.2在数学编程竞赛应用 利用V3.2搭建通用智能体工作流 DeepSeekV3.2工具调用与安全边界 DeepSeekV3.2长文本推理输出优势 Speciale思考模式不支持工具限制 DeepSeekV3.2在企业私有化部署前景 DeepSeekV3.2与其他国产大模型对比

推荐工具

更多