Featured image of post OpenAI 模型独自推翻了一道 80 年数学难题——这次不是辅助,是自主

OpenAI 模型独自推翻了一道 80 年数学难题——这次不是辅助,是自主

一个通用推理模型接收问题陈述,独立产出完整证明,推翻了 Erdős 1946 年猜想。它与 AlphaProof、AlphaGeometry 的本质区别在哪,这次突破到底意味着什么。

2026 年 5 月 20 日,OpenAI 联合创始人 Greg Brockman 在 X 上发了一条公告,语气平静得有些反常——

“An OpenAI model has achieved a major breakthrough in mathematics, by disproving a central conjecture in discrete geometry that was first posed by Paul Erdős in 1946. This is the first time AI has autonomously solved a prominent open problem central to a field of mathematics.”

这句话里有几个词值得停下来读一遍:autonomously(自主地)prominent open problem(核心开放问题)first time(首次)

它们不是营销语言。


Erdős 和那道困了数学界 80 年的题

Paul Erdős 是 20 世纪最多产的数学家之一,一生发表论文超过 1500 篇,合作者遍布全球,多到数学界专门发明了"Erdős 数"来追踪与他的合作距离。他有个习惯:把自己解不出来的问题整理成列表,标上悬赏金额,向全世界征解。

这道题就是他在 1946 年提出的:平面单位距离问题(Planar Unit Distance Problem)

题目本身并不难懂。想象平面上摆着 n 个点,随便你怎么放。问:这 n 个点里,最多可以有多少对点的距离恰好等于 1?

直觉上,如果你把点摆成正方形网格,相邻的点距离是 1,斜对角是 √2——单位距离的点对大约和 n 成正比。Erdős 猜想这就是上界的数量级,更精确地写成 n^(1+o(1)),意思是增长速度"接近线性,但略微超过"。

听起来像个结论,但它只是猜想。

平面单位距离问题:20个点之间恰好等于1的距离对用蓝色连线标出,正六边形排布能使单位距离对数量最大化

接下来的 80 年里,无数数学家试图证明这个上界,或者找到突破它的构型。Fields 奖得主 Terry Tao、Jean Bourgain 都曾在这个问题上留下过工作,但每次进展都是微小的参数改进,没有人能把它彻底推翻,也没有人能彻底证明它。

这道题就这么悬在那儿。


OpenAI 模型做了什么

2026 年 5 月,OpenAI 把这个问题交给了自己的一个内部通用推理模型。

没有专门的数学框架,没有人工设计的推理链,没有逐步的人类引导——只有一张问题陈述。

模型返回了一个证明。

证明的核心结论是:存在一种 n 个点的平面配置,使得恰好 1 单位距离的点对数量至少达到 n^(1+δ),其中 δ 是某个固定的正指数。

这推翻了 Erdős 的猜想。不是改进了上界,是从根本上证明了 Erdős 想象中的"接近线性"是错的,单位距离对的数量可以超越那个边界。

证明的方法是把代数数论具体几何问题连接起来,把平面点集的距离问题转化成了数论中某种代数结构的计数问题。OpenAI 随后邀请了一组外部数学家独立验证,对方确认证明是正确的,并撰写了配套的解读论文,专门解释证明的背景和论证结构。


这次和以前的 AI 数学工作有什么不一样

过去几年,AI 在数学上的进展已经有了几个值得注意的节点:

AlphaGeometry(2024) 能在奥数几何题上达到金牌水平,但它用的是神经网络加形式化符号系统的混合架构,整套推理框架是人工设计的,AI 在其中负责填充具体步骤。

AlphaProof(2024) 可以证明奥数中的竞赛题,也是在形式化证明语言(Lean)的框架里工作,问题被提前"翻译"成机器可操作的格式,证明过程由人类研究者选定。

它们很强,但有一个共同特点:人类的介入不只是提问,而是设计了整套工作框架。AI 在其中像一个被放进跑道里的赛马,跑得很快,但跑道是人铺的。

左侧:AlphaGeometry/AlphaProof 需要人工设计框架+形式化语言+分步引导;右侧:OpenAI 模型直接从自然语言问题输出完整证明

这次的 OpenAI 模型不同。

它接收的是一段文字描述的数学问题,没有翻译成形式语言,没有人告诉它从哪个方向入手,也没有提供任何中间步骤的提示。它产出的是一段完整的证明,然后交给人类验证。

HN 上一条高赞评论说得很到位:

“Either ‘recombining existing material’ is not disqualifying, or a lot of Fields Medals need to be returned.”

(“要么’重组已有材料’本身不是一种贬低,要么得把很多 Fields 奖奖章收回去。")

这句话指向一个真正值得思考的问题:我们评价数学发现的标准,到底是什么?


数学家怎么看

Fields 奖得主 Tim Gowers 在看到这个结果后公开表示,这个结果引出了"真正有趣且微妙的问题”——他的措辞是克制的,但 Gowers 向来是这种风格。他没有说"AI 成了数学家",也没有说"这只是个工具"。

这种克制本身说明了一些事情。

数学界的主流分歧大致是这样的:支持者认为,AI 在这道题上展示了跨域知识连接能力,把代数数论和平面几何拉到同一个框架里,这本身不是一件容易的事,哪怕对人类数学家也不是。反对者说,现有模型是"插值机器",只能在训练数据的隐含模式里打转,难以实现真正的范式突破,比如微积分或广义相对论那种级别的飞跃。

两种看法都有道理,但有一点正在变得难以否认:那种"大语言模型不可能做出真正的数学发现"的论断,需要重新校准了。


这意味着什么,以及它的边界

先说意义。

这不是 AI 替代数学家的信号,但它确实是一个节点:AI 作为独立提出数学论证的主体,而非单纯的辅助计算工具,已经在这道题上成立了

对科研工作流来说,这个节点的含义比听起来更具体。如果一个通用推理模型可以接到开放问题、自主探索、产出可验证的证明,那么它在科研中的位置就不再只是"帮我查文献"“帮我写代码”,它开始具备了参与"想问题"本身的可能。

再说边界。

这次的问题,尽管开放了 80 年,仍然属于一类有明确陈述、有清晰验证标准的数学问题。AI 的证明是在一个相对封闭的问题空间里完成的,所用的工具(代数数论、组合几何)都是已知框架。

那些真正改变人类认知底层结构的发现,比如提出一个全新的数学分支,或者察觉到两个毫不相关领域之间的深层联系——这仍然是一个开放的问题。目前没有证据表明现有模型能做到这一点,批评者的这个担忧并不是无理的。

但"能做到哪些"的边界,正在以一种让所有人都很难预测节奏的方式,持续向外扩展。


结尾

有一个细节我觉得值得记下来。

OpenAI 在宣布这个结果的时候,没有大张旗鼓地说"我们的模型解决了 Erdős 问题"。Greg Brockman 的那条推文很简洁,用词很谨慎——“disproved a central conjecture”,而不是"solved mathematics"。

这种克制,和数学界的反应里那种审慎,倒是构成了某种对称。

数学界通常是最不容易被热情感染的群体。如果连 Tim Gowers 都说这个结果引出了"真正有趣且微妙的问题",大概不是客气话。


参考来源

RSS Feed 使用 Hugo 构建
主题 StackJimmy 设计