法国独角兽 Mistral AI 于12月2日推出 Mistral3系列模型,包括3B、8B、14B 三个小型密集模型及迄今最强的 Mistral Large3,覆盖从边缘设备到企业级推理的全场景需求。新模型沿用 Apache2.0开源协议,权重已同步上传至 Hugging Face 与 GitHub,允许商业免费使用。
Mistral3系列在保持前代低延迟优势的同时,将上下文长度扩展至128K,并在 MMLU、HumanEval、MT-Bench 等主流基准中与 Llama3.1同规格模型打平或小幅领先。公司表示,通过“滑动窗口注意力 + 分组查询注意力”混合设计,14B 版本在单张 A100即可完成128K 全上下文推理,批量场景下吞吐量提升42%,为学术研究、商业分析、教育内容生成等应用提供更高性价比。

图源备注:图片由AI生成,图片授权服务商Midjourney
Mistral AI 联合创始人兼首席科学家 Guillaume Lample 指出:“我们的使命是让高性能 AI 摆脱供应商锁定。开发者无需巨额预算,也能获得与闭源方案媲美的效果。”目前,Mistral Large3已在公司官方平台 Le Platforme 上线 API,定价为每百万 token 输入0.8美元、输出2.4美元,约为 GPT-4o 的一半,并支持微调与私有部署。行业分析认为,借助欧洲 GDPR 合规优势及开放权重策略,Mistral3有望进一步蚕食中小企业与公共部门市场,推动 AI 基础设施“多极化”竞争。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则