重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

AIbase 报道 北京时间最新消息，国内 AI 独角兽 MiniMax 即将推出新一代大模型 M3。MiniMax AI 工程负责人 Skyler Miao 近日在社交平台释放预告，称“Something BIG is coming!”，引发业界广泛关注。

重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

M3核心架构创新:稀疏注意力机制

据透露，M3采用了全新稀疏注意力（Sparse Attention）架构，通过 Index Branch 快速索引与 Sparse Branch 精准计算相结合的方式，有效解决了超长上下文场景下的计算瓶颈。

传统 Transformer 在处理百万 Token 级别上下文时，计算量会随序列长度呈平方级增长。而 M3的稀疏设计能大幅降低这一开销，在保持高性能的同时实现显著的效率跃升，为长文本理解、长对话、多文档分析等应用场景提供有力支撑。

实测性能大幅领先 M2

对比前代 M2（支持1M Token 上下文），M3在关键指标上取得突破性提升:

Prefill 阶段速度提升9.7倍
Decoding 阶段速度提升15.6倍

这意味着在实际部署中，M3能够以极低的算力成本高效处理超长上下文，显著降低推理成本，并为更复杂的 AI 应用打开想象空间。

行业意义:长上下文时代的效率新标杆

MiniMax 此次 M3的预告再次凸显了国内 AI 企业在架构创新上的竞争力。稀疏注意力等技术的突破，有望推动大模型从“参数规模竞赛”转向“效率与实用性竞赛”，为企业级落地和消费者应用带来更实惠、高效的体验。

目前 MiniMax 尚未公布 M3的具体发布时间与完整参数规模，但从工程负责人的预告及性能数据来看，这款模型有望成为长上下文处理领域的有力竞争者。AIbase 将持续关注 MiniMax M3的后续动态，第一时间带来最新报道。

【搬运】AI动画制作流程揭秘！综合实拍+合成+ai视频转绘技术（带中文字幕）

30.2万用户在看

中国人工智能缩小与美国差距

21.2万用户在看

七个圈AIGC破圈俱乐部欢迎您！

19.3万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

17.6万用户在看

重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

最近更新

文章目录

重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

M3核心架构创新:稀疏注意力机制

实测性能大幅领先 M2

行业意义:长上下文时代的效率新标杆

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

【搬运】AI动画制作流程揭秘！综合实拍+合成+ai视频转绘技术（带中文字幕）

30.2万 用户在看

中国人工智能缩小与美国差距

21.2万 用户在看

七个圈AIGC破圈俱乐部欢迎您！

19.3万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

17.6万 用户在看

重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

最近更新

文章目录

重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

M3核心架构创新:稀疏注意力机制

实测性能大幅领先 M2

行业意义:长上下文时代的效率新标杆

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

30.2万用户在看

21.2万用户在看

19.3万用户在看

17.6万用户在看