近期,数学界见证了人工智能的一场里程碑式突破。前量化研究员 Neel Somani 在测试 GPT5.2 模型时发现,AI 仅需15分钟思考,便给出了数学传奇保罗·埃尔德什(Paul Erdős)未解难题的完整证明,其严谨性已通过 Lean 等形式化工具验证。
长期以来,埃尔德什留下的1000多个数学猜想被视为人类智慧的边界。然而自去年圣诞节以来,该网站已有 15个问题被标记为“已解决”,其中 11个方案明确有 AI 参与。

Somani 指出,GPT5.2在数学推理上表现出前所未有的熟练度。它不仅能熟练运用勒让德公式等公理,甚至在哈佛数学家 Noam Elkies 既有研究的基础上,给出了更完整的解决方案。这种对“长尾”数学难题的批量攻克,引发了 LLM 是否正拓展人类知识边界的广泛讨论。
菲尔兹奖得主陶哲轩在其 GitHub 页面上对这一进展进行了细致统计,记录了8个 AI 取得自主进展的案例。他推测,AI 的可扩展性使其在处理晦涩、简单的“长尾”问题上比人类更具优势。
除了模型本身的进化,形式化工具(如 Harmonic 公司的 Aristotle)的介入也至关重要。这些工具能将 AI 生成的推理自动转化为计算机可验证的代码,极大简化了验证过程。Harmonic 创始人 Tudor Achim 表示,相比解题数量,世界级数学教授开始公开承认使用 AI 工具,才是证明 AI 实力的最有力证据。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则