Alphabet旗下谷歌正式发布Gemini3首次提供100万tokens上下文窗口,支持文本、图像、视频与代码原生多模态推理。官方称,Gemini3Pro在GPQA Diamond研究生级测试获91.9%准确率,在LMArena以1501Elo登顶,超越GPT-5.1与Claude4.5,成为目前公开榜单最高分模型。

Gemini3采用全新Deep Think增强推理模式,通过“思维签名”与“思考等级”将推理链产品化,ARC-AGI-2得分45.1%,在多步逻辑、事实准确性与科学图表理解维度刷新SOTA。谷歌同步推出Google Antigravity开发平台,支持“代理式编码”与“可视化编码”,LiveCodeBench Pro Elo2439,Terminal-Bench2.0终端操作准确率54.2%,可自主完成数据爬取、分析、报告与部署全链路。

Gemini3即日起向Google AI Ultra订阅用户开放,未来几周陆续覆盖Gemini应用、AI Mode搜索与企业级Vertex AI。谷歌表示,模型在自研TPU v6Pods训练,配合90%搜索市占与20亿“AI概览”月活,将加速AI从实验室走向生产线。