内容持续更新中
近日,谷歌的 FACTS 团队与数据科学单位 Kaggle 联合发布了 FACTS 基准套件,旨在填补当前 AI 模型评估中对事实准确性缺乏标准化的空白。该基准套件提供了一种全面的评估框架,特别适用于…
谷歌的 FACTS (Factual Consistency and Truthfulness Score) 团队与数据科学平台 Kaggle 于今日联合发布了 FACTS 基准测试套件。…
近日,谷歌与 Kaggle 联合举办的首届 AI 国际象棋对战赛事备受瞩目。在这一场 “智力的较量” 中,马斯克旗下的 Grok4展现了非凡的实力,成为首日比赛的绝对焦点。 这场比赛聚集了多款顶尖 A…
在人工智能领域,围棋和国际象棋等战略游戏一直是测试模型推理能力的重要舞台。最近,Google DeepMind 与 Kaggle 联合宣布,将于8月5日至7日举办一场 AI 国际象棋锦标赛。这场比赛不…
维基百科近日宣布,将通过与谷歌旗下的数据科学社区平台 Kaggle 的合作,发布一份专门优化用于人工智能模型训练的数据集。这一举措旨在减少 AI 开发者通过爬虫程序抓取维基百科数据的行为,保护平台的带…
最近在东京举办的 Gemma 开发者日上,谷歌正式推出了新的日语版本 Gemma AI 模型。这款模型的表现可以与 GPT-3.5媲美,但它的参数量只有仅仅20亿,非常小巧,适合在移动设备上运行。 这…
在近期的一项研究中,OpenAI研究团队推出了名为 MLE-bench 的全新基准测试,旨在评估AI智能体在机器学习工程方面的表现。 这项研究特别关注75个来自 Kaggle 的机器学习工程相关竞赛,…