全球 AI 算力竞赛再次加码。5 月 25 日,埃隆·马斯克(Elon Musk)正式宣布,xAI 旗下最新旗舰模型 Grok V9-Medium 已圆满完成训练阶段。作为一款拥有 1.5 万亿(1.5T)参数的超大规模基础模型,其规模是目前支撑 Grok 所有生产线流量的 v8-small 版本(0.5T 参数)的整整三倍。
核心看点:
规模跨越: 从 0.5T 直接跃升至 1.5T 参数,模型在推理深度与复杂任务处理能力上实现了质的飞跃。
编程特化: 在补充训练阶段,xAI 引入了海量 Cursor(AI 编程工具) 的代码数据,旨在显著增强其处理复杂编程任务的能力。
进度时间表: 目前模型已进入监督微调(SFT)阶段,强化学习(RL)即将启动,预计在 2 至 3 周内正式面向公众发布。
底层架构优化: 马斯克透露,该模型经过了针对 NVIDIA Blackwell 架构 GPU 的深度优化,算力效率将大幅提升。
“编程 AI”新格局:xAI 正面硬刚顶尖代码助手
此次 Grok V9-Medium 的发布,最引人瞩目的在于其“编程基因”。马斯克此前曾坦言,现有的 v8-small 版本在训练数据的质量、全面性及比例平衡上存在明显短板,而 V9-Medium 则是针对这些痛点进行的系统性重构。
通过引入 Cursor 的代码逻辑与实战数据,xAI 意图让这款新模型在开发者生态中建立绝对的技术优势。对于开发者而言,Grok V9-Medium 不仅仅是一个通用的聊天机器人,更有望成为能够深度理解复杂代码库、自主完成复杂编程逻辑的“AI 工程师”。
为什么要加 Cursor 的数据?
Cursor 作为当前主流的 AI 编程辅助工具,其背后的代码调用习惯、工程化思路和 bug 修复路径代表了顶尖软件工程的实践。xAI 将这些数据纳入“补充训练”(Supplemental Training),意味着 Grok 将跳过单纯的语言模型阶段,直接进入“工程化实践”阶段。
这种做法被行业观察者视为 xAI 的“换道超车”:不再仅仅通过通用的语料库进行训练,而是直接学习人类专业工程师在编程工具中最真实、最直接的思维方式。
市场预期:大模型“基准”之战将重写
随着 Grok V9-Medium 预计在 6 月中旬上线,AI 领域的竞争将进入新一轮白热化:
性能标杆的重塑: 1.5T 参数规模意味着它在逻辑推理与复杂指令遵循上,将直接对标业界最顶尖的多模态模型。
Blackwell 架构的红利: 作为首批深度适配 Blackwell 架构的 AI 大模型,其在处理效率和推理成本上的表现,将直接影响 xAI 在 Tesla 车辆端侧与 X 平台应用端的部署策略。
对于 xAI 团队而言,Grok V9-Medium 不仅是性能上的升级,更是其构建“开发者优先”AI 平台的关键一步。在接下来的两周内,随着微调与强化学习工作的收尾,这款“编程利器”的表现将决定它能否在代码辅助与开发者工具赛道中,从 Anthropic 的 Claude 或 DeepSeek 等竞争对手手中分得一杯羹。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则