在人工智能的激烈竞争中,阿里云再一次发力,正式推出了其最新的 AI 语言模型 ——Qwen3-Max。这款模型不仅是通义团队迄今为止规模最大、能力最强的产品,其参数总数超过了1万亿,显著提升了多项技术能力,给业界带来了新的震撼。

Qwen3-Max-Instruct 版本在代码能力和智能体表现上都有了质的飞跃,特别是在知识推理、编程能力、指令遵循和多语言理解等多个领域,Qwen3-Max 的表现均处于行业领先水平。阿里云的通义团队还透露,另一个正在训练中的版本 Qwen3-Max-Thinking 已展现出非凡的潜力,预计很快将与公众见面。这个 “思考” 版本在一些高难度的推理测试中取得了100% 的准确率,显示了其出色的推理能力。

阿里云发布超强AI大模型Qwen3-Max,性能傲视群雄!

在训练方面,Qwen3-Max 模型的预训练使用了36万亿个 tokens,得益于其独特的 MoE 模型结构设计,训练过程稳定且高效。通过 PAI-FlashMoE 的优化,Qwen3-Max 的训练效率显著提高,能够支持长达1M 的上下文训练。同时,阿里云还通过多种技术手段降低了因硬件故障带来的时间损失,确保了训练的高效进行。

阿里云发布超强AI大模型Qwen3-Max,性能傲视群雄!

在实际应用中,Qwen3-Max-Instruct 已在 LMArena 的文本排行榜上稳居全球前三,超越了知名的 GPT-5-Chat。在专注于现实编程挑战的基准测试 SWE-Bench Verified 中,Qwen3-Max-Instruct 取得了69.6的高分,显示了其卓越的编程能力。而在智能体工具调用能力的测试 Tau2-Bench 中,Qwen3-Max-Instruct 也以74.8分的优异成绩,成功超越了 Claude Opus4和 DeepSeek-V3.1。

可以说,阿里云的 Qwen3-Max 不仅在技术参数上领先,更在应用性能上展现了强大的能力,为人工智能的未来发展注入了新的动力。