小米 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%

在 AI 模型价格战持续升温的背景下，小米旗下 MiMo 大模型于5月27日正式发布公告，对其 MiMo-V2.5系列 API 实施永久性降价，并同步优化了计费体系，旨在通过技术红利进一步降低开发者的调用成本。

小米 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%

一、API 价格大幅下调，最高降幅99%

本次调价已于北京时间 5月27日0:00 全球同步生效。此次调整覆盖 MiMo-V2.5和 MiMo-V2.5Pro 两个核心版本，且不再区分上下文窗口长度，定价策略更趋向于极简与透明。

模型版本	输入缓存命中价格	最高降幅	输出价格	最高降幅
MiMo-V2.5Pro	0.025元/百万 tokens	99%	6元/百万 tokens	86%
MiMo-V2.5	0.02元/百万 tokens	98%	2元/百万 tokens	93%

二、计费体系升级:加量不加价

除了直接的 API 单价下调，小米还对 Token Plan 计费体系进行了深度优化:

额度翻倍: 在保持原价格标准的前提下，Token 的实际用量额度提升至原来的 5至8倍。
规则简化: 引入 Credits（积分） 概念，旨在替代此前复杂的计费方式，使开发者对 Token 的消耗与成本计算更直观、易懂。

小米 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%

三、技术底座:为何能持续降价?

小米官方透露，此次大幅降价的底气源于其在推理系统底层架构上的技术突破:

SWA 推理优化: 基于 SGLang HiCache 完整支持 SWA（滑动窗口注意力机制），使得 KV Cache 在 GPU 显存、CPU 内存及 SSD 之间的多级搬运数据量减少至原来的1/7。
缓存效率提升: 可缓存 Token 数量激增至优化前的近5倍，显著提升了缓存命中率，大幅摊薄了单位推理成本。
集群吞吐优化: 通过引入专家并行（MoE）方案与输入长度分桶策略，集群的输入吞吐能力得到质的提升，确保在服务质量保持高水准的同时，持续压低单位 Token 的服务成本。

小米此举被业内视为对当前大模型商业化“内卷”的积极回应。随着价格门槛的进一步降低，MiMo 系列模型的性价比优势将进一步显现，加速 AI 能力在各垂直行业及开发者工作流中的深度渗透。

【搬运】AI动画制作流程揭秘！综合实拍+合成+ai视频转绘技术（带中文字幕）

30.1万用户在看

中国人工智能缩小与美国差距

21.2万用户在看

七个圈AIGC破圈俱乐部欢迎您！

19.3万用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

17.6万用户在看

小米 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%

最近更新

文章目录

小米 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%

一、API 价格大幅下调，最高降幅99%

二、计费体系升级:加量不加价

三、技术底座:为何能持续降价?

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

【搬运】AI动画制作流程揭秘！综合实拍+合成+ai视频转绘技术（带中文字幕）

30.1万 用户在看

中国人工智能缩小与美国差距

21.2万 用户在看

七个圈AIGC破圈俱乐部欢迎您！

19.3万 用户在看

3款AI工具让历史名人‘复活’：梵高、莫扎特、奥斯汀等重现当下

17.6万 用户在看

小米 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%

最近更新

文章目录

小米 MiMo-V2.5 系列 API 永久降价，最高降幅达 99%

一、API 价格大幅下调，最高降幅99%

二、计费体系升级:加量不加价

三、技术底座:为何能持续降价?

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

30.1万用户在看

21.2万用户在看

19.3万用户在看

17.6万用户在看