Qwen 团队在11月初公布 Qwen3-Max-Thinking 的早期预览版本,称该模型为仍在训练中的中间检查点。官方表述指出,在结合工具使用与扩大测试时推理计算(test-time compute)后,该模型在 AIME 2025 与 HMMT 等高难度推理基准上取得 100% 成绩。当前版本已开放于 Qwen Chat,并可通过阿里云 Model Studio API 以 enable_thinking 参数启用思考模式进行调用。
需要提示的是,公开第三方榜单通常采用固定设置,不一定计入外部工具或非常规测试时算力扩展,因此与厂商宣称的“工具增强+扩大算力”结果可能存在口径差异。近期可见的 AIME 2025 汇总榜单尚未普遍显示“100%”满分记录,后续是否被统一收录需视评测规则与复现流程而定。总体而言,此次发布系功能预览,训练与指标仍将持续更新。
常见问题
Q:Qwen3-Max-Thinking 现在能在哪里使用?
A:可在 Qwen Chat 前端试用,也可通过阿里云 Model Studio API 调用,在请求中设置 enable_thinking=True 以开启思考模式。
Q:宣称的 AIME 2025、HMMT“100%”具体条件是什么?
A:官方说明为在“工具增强+扩大测试时推理算力”条件下获得;与标准封闭设置的公共榜单存在口径差异。
Q:公开排行榜为何未必显示满分?
A:许多榜单要求固定温度、无外部工具或限定推理预算;若与官方实验设置不同,分数可能不一致或尚未收录。
Q:这是正式版吗?
A:不是。该版本为早期预览且仍在训练中,后续能力与稳定性可能变化,官方称将持续更新。
Q:API 如何启用思考模式?
A:在阿里云 Model Studio 的相关接口中使用 enable_thinking 参数;具体实现文档已提供示例说明。