内容持续更新中
谷歌发布Gemini 3后,其中Gemini 3 Pro以1501 Elo刷新LMArena公开榜单历史最高分,超越GPT-5.1、Claude 4. 5 与Grok-4.1,成为目前评分最高的多模态…
在全球人工智能领域,竞争愈发激烈,最新消息显示,文心全新发布的 ERNIE-5.0-Preview-1022 模型在 LMArena 大模型竞技场的最新排名中脱颖而出,成为国内文本能力的冠军,同时在全…
据腾讯官方微信公众号发布的消息,腾讯自研的 混元图像3.0 大模型在文生图领域的“权威竞技场”——LMArena 最新榜单中成功突围,登顶第一。这一成绩不仅超越了全球26个大模型,更将包括 Nano …
AIBase消息,OpenAI的GPT-5在权威AI模型评测平台LMArena中创造历史,以最高Arena得分登顶排行榜首位,超越Google Gemini2.5Pro和Anthropic Claud…
近日,备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司,名为 Arena Intelligence Inc.,以便为未来的项目改进提供更强大的资源。LMArena 的创始团队在博客中表…
在最新的 LM Arena Search Arena 评估中,Perplexity 公司的 Sonar-Reasoning-Pro-High 模型表现优异,与谷歌的 Gem-2.5-Pro-Groun…
近日,Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名,这一剧烈波动引发了开发者们的广泛质疑,认为 Meta 可能通过提交特供版本…
Meta周六发布了其新旗舰AI模型Maverick,该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而,多位AI研究人员很快发现,M…