阿里云旗下的 Qwen 团队宣布推出其最新 AI 模型 ——Qwen3-Max。这款模型以其超大规模和强大能力,标志着人工智能技术的新突破。Qwen3-Max 的发布不仅在 LMArena 文本排行榜上位列第三,超越了竞争对手 GPT-5-Chat,还在多个基准测试中表现出色,尤其是在代码生成和智能体能力方面。

Qwen 发布全新 AI 模型 Qwen3-Max:不仅能写代码,还能自主思考

Qwen3-Max 模型的总参数超过1万亿,预训练使用了36万亿个 tokens。得益于 Qwen3系列的先进 MoE 模型结构设计,Qwen3-Max 在训练稳定性和高效性方面取得了显著进展。通过创新的 PAI-FlashMoE 多级流水并行策略,该模型的训练效率比之前的版本提升了30%。在长序列训练场景中,Qwen3-Max 采用的 ChunkFlow 策略使得吞吐量提升了3倍,支持1百万长上下文的训练。

Qwen3-Max-Instruct 是这一系列模型中的重要组成部分,其在编程基准测试 SWE-Bench Verified 中取得了69.6分的优异成绩,证明了其在实际编程挑战中的卓越能力。此外,该模型在 Tau2-Bench 基准测试中以74.8分的成绩,超越了 Claude Opus4和 DeepSeek-V3.1,显示了其在智能体工具调用能力方面的突破性表现。

值得一提的是,Qwen3-Max 的推理增强版本 ——Qwen3-Max-Thinking,凭借集成的代码解释器和并行计算技术,在极具挑战性的数学推理基准测试 AIME25和 HMMT 中取得了满分的优异成绩。团队对这一版本的前景充满信心,并期待尽快将其推向市场。

Qwen 团队表示,用户现在可以通过阿里云 API 直接体验 Qwen3-Max-Instruct 模型的强大能力。相关 API 已开放,使用者只需简单的步骤即可注册和获取 API 密钥,便可调用 Qwen3-Max 进行开发。

Qwen3-Max 的发布不仅推动了 AI 技术的发展,还为开发者提供了更加强大的工具,助力其在各行各业中创造更多的价值。随着这一技术的普及,Qwen 团队相信,人工智能的未来将更加光明。