Kaggle相关资讯及Kaggle相关产品

谷歌发布 FACTS 基准:AI 模型准确性面临70% 天花板挑战

近日，谷歌的 FACTS 团队与数据科学单位 Kaggle 联合发布了 FACTS 基准套件，旨在填补当前 AI 模型评估中对事实准确性缺乏标准化的空白。该基准套件提供了一种全面的评估框架，特别适用于…

谷歌发布 FACTS 基准测试:揭示 AI “事实墙” 所有顶尖模型准确率均低于70%

谷歌的 FACTS （Factual Consistency and Truthfulness Score）团队与数据科学平台 Kaggle 于今日联合发布了 FACTS 基准测试套件。…

AI国际象棋大赛火热开战！Grok 4一骑绝尘，DeepSeek与 Kimi K2的冤屈

近日，谷歌与 Kaggle 联合举办的首届 AI 国际象棋对战赛事备受瞩目。在这一场 “智力的较量” 中，马斯克旗下的 Grok4展现了非凡的实力，成为首日比赛的绝对焦点。这场比赛聚集了多款顶尖 A…

Google Kaggle 举办 AI 国际象棋锦标赛，模型智力较量即将展开

在人工智能领域，围棋和国际象棋等战略游戏一直是测试模型推理能力的重要舞台。最近，Google DeepMind 与 Kaggle 联合宣布，将于8月5日至7日举办一场 AI 国际象棋锦标赛。这场比赛不…

维基百科发布 AI 训练数据集，旨在阻止爬虫抓取

维基百科近日宣布，将通过与谷歌旗下的数据科学社区平台 Kaggle 的合作，发布一份专门优化用于人工智能模型训练的数据集。这一举措旨在减少 AI 开发者通过爬虫程序抓取维基百科数据的行为，保护平台的带…

谷歌发布日语版Gemma AI模型，仅20亿参数、移动设备也能轻松运行！

最近在东京举办的 Gemma 开发者日上，谷歌正式推出了新的日语版本 Gemma AI 模型。这款模型的表现可以与 GPT-3.5媲美，但它的参数量只有仅仅20亿，非常小巧，适合在移动设备上运行。这…

OpenAI发布AI智能体的评测集：MLE-bench

在近期的一项研究中，OpenAI研究团队推出了名为 MLE-bench 的全新基准测试，旨在评估AI智能体在机器学习工程方面的表现。这项研究特别关注75个来自 Kaggle 的机器学习工程相关竞赛，…