内容持续更新中
4月15日,全球权威AI模型评测平台LM Arena公布最新Video Edit(视频编辑)方向排行榜,阿里巴巴ATH事业群旗下的happyhorse-1.0模型以1299分的Elo评分位列全球榜首,…
3月20日,权威大模型盲测榜单LMArena发布的最新一期排名显示,阿里巴巴旗下千问系列最新旗舰预览版模型Qwen3.5-Max-Preview表现强劲,以1464分的成绩位列榜单前列。这一数据不仅刷…
微软 AI 首席执行官穆斯塔法·苏莱曼宣布推出第二代图像生成模型 MAI-Image-2。该模型在权威评测榜单 LMArena 中表现强劲,直接跃升至全球第三位。 在被誉为 AI 生图界“最高竞技场”…
中国大模型在国际顶尖竞技场上再次刷新了纪录。3月20日,阿里千问家族迎来旗舰级新成员 —— Qwen3.5-Max-Preview。该模型首发亮相全球大模型竞技平台 LM Arena,便以1464分的…
紧随“元宝春节10亿红包”活动的火热开启,腾讯混元团队于1月28日正式宣布,开源其最新的 混元图像3.0图生图模型 (HunyuanImage3.0-Instruct)。该模型凭借800亿…
中国大模型再次刷新全球认知。百度正式发布并上线文心大模型最新版本——ERNIE-5.0-0110,在权威评测平台LMArena最新文本能力排行榜中,以1460分的成绩强势跻身全球第八,成为目前唯一进入…
近日,全球公认的大模型“竞技场”LMArena发布了最新的模型排名。根据AIbase获悉的最新数据显示,百度新一代模型ERNIE-5.0-Preview-1203凭借1451的高分正式登上文本榜单。值…
谷歌发布Gemini 3后,其中Gemini 3 Pro以1501 Elo刷新LMArena公开榜单历史最高分,超越GPT-5.1、Claude 4. 5 与Grok-4.1,成为目前评分最高的多模态…
在全球人工智能领域,竞争愈发激烈,最新消息显示,文心全新发布的 ERNIE-5.0-Preview-1022 模型在 LMArena 大模型竞技场的最新排名中脱颖而出,成为国内文本能力的冠军,同时在全…
据腾讯官方微信公众号发布的消息,腾讯自研的 混元图像3.0 大模型在文生图领域的“权威竞技场”——LMArena 最新榜单中成功突围,登顶第一。这一成绩不仅超越了全球26个大模型,更将包括 Nano …
AIBase消息,OpenAI的GPT-5在权威AI模型评测平台LMArena中创造历史,以最高Arena得分登顶排行榜首位,超越Google Gemini2.5Pro和Anthropic Claud…
近日,备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司,名为 Arena Intelligence Inc.,以便为未来的项目改进提供更强大的资源。LMArena 的创始团队在博客中表…
在最新的 LM Arena Search Arena 评估中,Perplexity 公司的 Sonar-Reasoning-Pro-High 模型表现优异,与谷歌的 Gem-2.5-Pro-Groun…
近日,Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名,这一剧烈波动引发了开发者们的广泛质疑,认为 Meta 可能通过提交特供版本…
Meta周六发布了其新旗舰AI模型Maverick,该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而,多位AI研究人员很快发现,M…