LMArena相关资讯及LMArena相关产品

阿里“黑马”模型happyhorse-1.0斩获LM Arena视频编辑冠军

4月15日，全球权威AI模型评测平台LM Arena公布最新Video Edit（视频编辑）方向排行榜，阿里巴巴ATH事业群旗下的happyhorse-1.0模型以1299分的Elo评分位列全球榜首，…

Qwen3.5-Max预览版登顶LMArena，国产大模型矩阵集体跻身全球前列

3月20日，权威大模型盲测榜单LMArena发布的最新一期排名显示，阿里巴巴旗下千问系列最新旗舰预览版模型Qwen3.5-Max-Preview表现强劲，以1464分的成绩位列榜单前列。这一数据不仅刷…

跻身全球前三：微软发布最强生图模型 MAI-Image-2

微软 AI 首席执行官穆斯塔法·苏莱曼宣布推出第二代图像生成模型 MAI-Image-2。该模型在权威评测榜单 LMArena 中表现强劲，直接跃升至全球第三位。在被誉为 AI 生图界“最高竞技场”…

中国模型登顶！阿里通义千问 3.5-Max 震撼亮相：全球排名跃升第五

中国大模型在国际顶尖竞技场上再次刷新了纪录。3月20日，阿里千问家族迎来旗舰级新成员 —— Qwen3.5-Max-Preview。该模型首发亮相全球大模型竞技平台 LM Arena，便以1464分的…

全球最强开源图生图!腾讯混元图像3.0正式开源，800亿参数助力 AI 创作

紧随“元宝春节10亿红包”活动的火热开启，腾讯混元团队于1月28日正式宣布，开源其最新的混元图像3.0图生图模型（HunyuanImage3.0-Instruct）。该模型凭借800亿…

国产大模型杀入全球前十！文心ERNIE 5.0登顶LMArena榜单，数学能力直逼GPT

中国大模型再次刷新全球认知。百度正式发布并上线文心大模型最新版本——ERNIE-5.0-0110，在权威评测平台LMArena最新文本能力排行榜中，以1460分的成绩强势跻身全球第八，成为目前唯一进入…

国产大模型首登顶！文心5.0 Preview在LMArena全球竞技场拿下中国最高分

近日，全球公认的大模型“竞技场”LMArena发布了最新的模型排名。根据AIbase获悉的最新数据显示，百度新一代模型ERNIE-5.0-Preview-1203凭借1451的高分正式登上文本榜单。值…

谷歌Gemini 3发布后迅速登顶LMArena排行榜，马斯克与阿尔特曼齐送祝贺

谷歌发布Gemini 3后，其中Gemini 3 Pro以1501 Elo刷新LMArena公开榜单历史最高分，超越GPT-5.1、Claude 4. 5 与Grok-4.1，成为目前评分最高的多模态…

LMArena最新排名：文心大模型5.0文本能力排名第一

在全球人工智能领域，竞争愈发激烈，最新消息显示，文心全新发布的 ERNIE-5.0-Preview-1022 模型在 LMArena 大模型竞技场的最新排名中脱颖而出，成为国内文本能力的冠军，同时在全…

腾讯混元图像3.0问鼎全球:用户真实投票力证其文生图能力

据腾讯官方微信公众号发布的消息，腾讯自研的混元图像3.0 大模型在文生图领域的“权威竞技场”——LMArena 最新榜单中成功突围，登顶第一。这一成绩不仅超越了全球26个大模型，更将包括 Nano …

GPT-5登顶LMArena排行榜：创造AI模型评测新纪录

AIBase消息，OpenAI的GPT-5在权威AI模型评测平台LMArena中创造历史，以最高Arena得分登顶排行榜首位，超越Google Gemini2.5Pro和Anthropic Claud…

LMArena正式成立公司，致力于提供中立的AI评估平台

近日，备受关注的人工智能评估平台 LMArena 宣布将成立一家新公司，名为 Arena Intelligence Inc.，以便为未来的项目改进提供更强大的资源。LMArena 的创始团队在博客中表…

Perplexity 竞技场夺冠，Sonar挑战谷歌Gemini的搜索霸主地位

在最新的 LM Arena Search Arena 评估中，Perplexity 公司的 Sonar-Reasoning-Pro-High 模型表现优异，与谷歌的 Gem-2.5-Pro-Groun…

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

近日，Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名，这一剧烈波动引发了开发者们的广泛质疑，认为 Meta 可能通过提交特供版本…

Meta被指AI模型"双标":评测版与公开版Maverick表现大相径庭

Meta周六发布了其新旗舰AI模型Maverick，该模型在LM Arena评测中排名第二。LM Arena是一项依靠人类评分者比较不同模型输出并选择偏好的测试平台。然而，多位AI研究人员很快发现，M…