在最近的财报会议上,Broadcom 的 CEO Hock Tan 透露,该公司在前一季度收到了来自 Anthropic 的100亿美元订单,专门用于提供谷歌最新的张量处理单元(TPU)。此外,Tan 表示,在第四季度又获得了来自同一客户的110亿美元订单,预计将在2026年底交付。这使得 Anthropic 总共订购了价值210亿美元的 TPU。

Broadcom 还透露,目前公司在人工智能产品订单方面积累了730亿美元的待交付订单,预计将在未来六个季度内发货。TPU 是谷歌开发的专门用于人工智能工作负载的加速器。现在已经进入第七代,TPU 不仅可通过谷歌云提供给客户,还为谷歌内部系统的训练和部署提供支持,包括 Gemini 系列模型的相关任务。谷歌负责 TPU 的架构设计,而 Broadcom 则将这些设计转化为可制造的硅片,并负责大规模生产。这一合作关系与谷歌一贯的战略相吻合,旨在控制关键的 AI 硬件设计,同时依赖半导体合作伙伴的制造专业知识。

作为 TPU 的长期用户,Anthropic 计划大规模扩展其基础设施,计划在2026年前部署100万个 TPU,配合超过一吉瓦的新计算能力。这将成为业内最大规模的专用 AI 计算建设之一。

除了 Anthropic,许多其他公司也确认使用 TPU,包括 Meta、Cohere、Apple 以及 Ilya Sutskever 的新创业公司 Super Safe Intelligence(SSI)。据《信息》报道,Meta 正在评估从2027年起在其数据中心部署 TPU。

TPU 的广泛应用源于其高效的能耗和针对 AI 训练与推理的优化性能,逐渐对 NVIDIA 的 GPU 市场份额形成竞争压力。Broadcom 表示,目前它的 TPU/XPU(定制 AI 加速器)客户已达到五家,尽管尚未完全公开其客户名单,但包括谷歌和 Anthropic 在内的客户已经得到了确认。

根据 SemiAnalysis 的最新分析,TPU v7的峰值浮点运算性能(FLOPs)和内存带宽比 NVIDIA 的 GB200平台低约10%,但其整体拥有成本(TCO)表现更为出色。SemiAnalysis 估计,谷歌内部部署 Ironwood 的成本比部署等效的 NVIDIA 系统低44%。即使对外客户报价,TPU v7的 TCO 也比 NVIDIA 的 GB200低约30%,而比即将推出的 GB300低约41%。该分析指出,如果 Anthropic 在 TPU 上实现约40% 的机器利用率,TPU 的有效训练成本每 FLOP 可能比 GB300级别的 GPU 集群低50% 至60%。

划重点:

🌟 Broadcom 与 Anthropic 签署了210亿美元的 TPU 订单,助力其 AI 基础设施的扩展。  

💡 TPU 被广泛应用于多家科技公司,因其高效能和对 AI 任务的优化而逐渐挑战 NVIDIA 的 GPU 市场。  

📉 TPU 的总体拥有成本低于 NVIDIA 的同类产品,显示出其在 AI 计算领域的竞争优势。