Qwen发布Qwen3-Max-Thinking早期预览：宣称在AIME 2025与HMMT达成100%

AI资讯 • Admin • 2025/11/4 • 109 次浏览

Qwen 团队在11月初公布 Qwen3-Max-Thinking 的早期预览版本，称该模型为仍在训练中的中间检查点。官方表述指出，在结合工具使用与扩大测试时推理计算（test-time compute）后，该模型在 AIME 2025 与 HMMT 等高难度推理基准上取得 100% 成绩。当前版本已开放于 Qwen Chat，并可通过阿里云 Model Studio API 以 enable_thinking 参数启用思考模式进行调用。

需要提示的是，公开第三方榜单通常采用固定设置，不一定计入外部工具或非常规测试时算力扩展，因此与厂商宣称的“工具增强+扩大算力”结果可能存在口径差异。近期可见的 AIME 2025 汇总榜单尚未普遍显示“100%”满分记录，后续是否被统一收录需视评测规则与复现流程而定。总体而言，此次发布系功能预览，训练与指标仍将持续更新。

常见问题

Q：Qwen3-Max-Thinking 现在能在哪里使用？

A：可在 Qwen Chat 前端试用，也可通过阿里云 Model Studio API 调用，在请求中设置 enable_thinking=True 以开启思考模式。

Q：宣称的 AIME 2025、HMMT“100%”具体条件是什么？

A：官方说明为在“工具增强+扩大测试时推理算力”条件下获得；与标准封闭设置的公共榜单存在口径差异。

Q：公开排行榜为何未必显示满分？

A：许多榜单要求固定温度、无外部工具或限定推理预算；若与官方实验设置不同，分数可能不一致或尚未收录。

Q：这是正式版吗？

A：不是。该版本为早期预览且仍在训练中，后续能力与稳定性可能变化，官方称将持续更新。

Q：API 如何启用思考模式？

A：在阿里云 Model Studio 的相关接口中使用 enable_thinking 参数；具体实现文档已提供示例说明。

Qwen发布Qwen3-Max-Thinking早期预览：宣称在AIME 2025与HMMT达成100%

相关文章

Anthropic与冰岛教育与儿童部合作：Claude将面向全国教师启动AI教育试点

Arc 浏览器：重构标签与侧边栏交互，助力知识工作者高效整理网页内容

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

Qwen发布Qwen3-Max-Thinking早期预览：宣称在AIME 2025与HMMT达成100%

相关文章

Anthropic与冰岛教育与儿童部合作：Claude将面向全国教师启动AI教育试点

Arc 浏览器：重构标签与侧边栏交互，助力知识工作者高效整理网页内容

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

提交AI工具

请确认提交信息