内容持续更新中
微软近日宣布,其 Azure ND GB300v6虚拟机在 Meta 的 Llama270B 模型上实现了每秒推理速度达110万token的行业新纪录。微软首席执行官萨提亚・纳德拉在社交媒体上表示:“…