近日,比利时布鲁塞尔自由大学(VUB)发布了一项足以载入 AI 史册的研究成果:商用大模型已具备独立生成原创数学证明的能力。实验显示,OpenAI 旗下的 ChatGPT-5.2 (Thinking) 成功破解了由数学家 Ran 与 Teng 在 2024 年提出的悬而未决的数学猜想。

ChatGPT-5.2 首次独立证明数学猜想,开启“氛围证明”时代

图源备注:图片由AI生成,图片授权服务商Midjourney

这一突破标志着大语言模型(LLM)的边界正式超越了代码辅助与文本创作,跨入了需要极高逻辑严密性的理论数学领域。数学界对此反应强烈,认为这预示着科学发现的范式正在发生根本性变革。

“氛围证明”横空出世:从对话中诞生的数学定理

研究团队将这种全新的科研模式命名为“vibe-proving(氛围证明)”,其灵感源自近期火爆的“氛围编程”。在整个证明过程中,ChatGPT 独立承担了证明路径的探索与核心逻辑框架的搭建,展现了超越数据组合的原创推理能力。

整个证明历经 7 轮对话交互与 4 个版本的自我迭代,最终形成了一套严谨的逻辑论证。尽管人类研究人员仍负责最后的校验工作,但 AI 表现出的推演效率远超人类数学家的预期。

行业重心位移:人类将从“生产者”转型为“验证者”

VUB 教授 Vincent Ginis 指出,这项成果打破了“AI 只有归纳能力而无创造力”的固有偏见。随着 AI 生成数学证明的门槛降低,理论数学的研究速度有望得到指数级提升。

未来数学界的核心瓶颈将从“寻找证明路径”转向“逻辑正确性校验”。当 AI 能够大规模产出高质量的猜想候选证明时,如何高效、自动化地完成人类验证,将成为下一个技术争夺的高地。