内容持续更新中
近日,谷歌正式发布了开源框架 LMEval,旨在为大语言模型(LLM)和多模态模型提供标准化的评测工具。这一框架的推出,不仅简化了跨平台模型性能比较,还支持文本、图像和代码等多领域的评估,展现了谷歌在…
在人工智能高速发展的赛道上,一个由几名学生创立的平台正悄然改变游戏规则。Chatbot Arena不仅成为全球最受瞩目的AI系统评测平台,更成为科技巨头们角力的重要战场。 这个由加州大学伯克利分校、斯…