DeepSeek-V3.2 发布:稀疏注意力带来的高效推理与通用 Agent 能力
一、摘要 DeepSeek-V3.2 是在 V3.2-Exp 基础上正式发布的版本,重点优化了推理效率与输出长度,并沿用 DSA 稀疏注意力机制以提升长上下文性能。DeepSeek-V3.2-Speciale 聚焦极限数学推理、编程竞赛与严谨逻辑验证,在多个国际竞赛评测中表现突出。当前网页端、APP...
Ai开源 • Admin •
174
找到 2 篇相关文章
一、摘要 DeepSeek-V3.2 是在 V3.2-Exp 基础上正式发布的版本,重点优化了推理效率与输出长度,并沿用 DSA 稀疏注意力机制以提升长上下文性能。DeepSeek-V3.2-Speciale 聚焦极限数学推理、编程竞赛与严谨逻辑验证,在多个国际竞赛评测中表现突出。当前网页端、APP...
两个月前,DeepSeek 发布实验性模型 V3.2-Exp,并通过用户回访确认其在各类场景中不逊于 V3.1-Terminus,验证了 DSA 稀疏注意力机制的有效性。最新发布的正式版 DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale 现已亮相,其中 V3.2 已在官网...