Qwen3-Max-Thinking来了:推理更准、思考更深,现已开放体验

前沿资讯 1762167409更新

0

导读: 阿里 通义千问团队 最新推出了Qwen3-Max的Thinking版本,现已在 Qwen Chat 平台(https://chat.qwen.ai/)开放体验。这一版本被称为“思考增强”版,主打更强的推理与问题分解能力,支持最高 8.2 万 tokens 的思考预算。


这次的“Thinking(思考)”版本,专为复杂推理场景打造。官方数据显示,该版本在 AIME 25HMMT 等高难度数学推理测试中均拿下满分,展现出强大的思考与推断能力。

Qwen3-Max 是 Qwen 系列目前规模最大的版本,参数量超过 1 万亿(1T),预训练数据高达 36T tokens。开发团队在架构上沿用了 Qwen3 的 Mixture-of-Experts(MoE) 设计,并通过 global-batch 负载均衡ChunkFlow 长序列优化,让训练过程稳定高效。

得益于这些底层改进,Qwen3-Max 从编程、智能体任务到多语言理解,都达到了业界顶尖水准。尤其是 Qwen3-Max-Instruct,目前已在 LMArena 文本榜上跻身前三,并在 SWE-Bench Verified 编程测试中拿下 69.6 分的高分。

而 Qwen3-Max-Thinking 则是在此基础上的“深思版”。它集成了 代码解释器并行测试计算 技术,让模型能够像人一样多步推理、验证假设,最终实现精准判断。这种改进使其在复杂逻辑、数学与策略问题上,展现出前所未有的稳定性与准确性。

目前,用户已经可以直接在 Qwen Chat 官网 选择 Qwen3-Max 并开启 Thinking 模式,即时体验这款“会思考的”升级版本。

从 Qwen3-Max 的“强实力”,到 Qwen3-Max-Thinking 的“深思维”,Qwen 团队正持续推动中文智能系统向更深层的推理方向发展。


参考资料:https://x.com/Ali_TongyiLab/status/1985159394644918525