今日,MiniMax M3模型正式面向市场发布,京东云JoyBuilder模型开发平台已同步完成接入,并在第一时间面向广大用户开放相关服务。

此次技术迭代的核心在于推理性能的显著改善。在应用部署方面,平台结合了自研的推理框架,并深度融合了PD分离部署、KV Cache缓存以及投机采样等多项前沿的推理优化技术

得益于这一系列底层技术的协同发力,新接入的模型在实际运行中实现了更高的推理吞吐量,整体响应效率也获得了大幅提升。这不仅能为开发者提供更流畅的调用体验,也有望进一步加速前沿大模型在具体业务场景中的落地应用。