OpenAI 模型独自推翻了一道 80 年数学难题—

2026 年 5 月 20 日，OpenAI 联合创始人 Greg Brockman 在 X 上发了一条公告，语气平静得有些反常——

“An OpenAI model has achieved a major breakthrough in mathematics, by disproving a central conjecture in discrete geometry that was first posed by Paul Erdős in 1946. This is the first time AI has autonomously solved a prominent open problem central to a field of mathematics.”

这句话里有几个词值得停下来读一遍：autonomously（自主地），prominent open problem（核心开放问题），first time（首次）。

它们不是营销语言。

Erdős 和那道困了数学界 80 年的题

Paul Erdős 是 20 世纪最多产的数学家之一，一生发表论文超过 1500 篇，合作者遍布全球，多到数学界专门发明了"Erdős 数"来追踪与他的合作距离。他有个习惯：把自己解不出来的问题整理成列表，标上悬赏金额，向全世界征解。

这道题就是他在 1946 年提出的：平面单位距离问题（Planar Unit Distance Problem）。

题目本身并不难懂。想象平面上摆着 n 个点，随便你怎么放。问：这 n 个点里，最多可以有多少对点的距离恰好等于 1？

直觉上，如果你把点摆成正方形网格，相邻的点距离是 1，斜对角是 √2——单位距离的点对大约和 n 成正比。Erdős 猜想这就是上界的数量级，更精确地写成 n^(1+o(1))，意思是增长速度"接近线性，但略微超过"。

听起来像个结论，但它只是猜想。

$平面单位距离问题：20个点之间恰好等于1的距离对用蓝色连线标出，正六边形排布能使单位距离对数量最大化$

接下来的 80 年里，无数数学家试图证明这个上界，或者找到突破它的构型。Fields 奖得主 Terry Tao、Jean Bourgain 都曾在这个问题上留下过工作，但每次进展都是微小的参数改进，没有人能把它彻底推翻，也没有人能彻底证明它。

这道题就这么悬在那儿。

OpenAI 模型做了什么

2026 年 5 月，OpenAI 把这个问题交给了自己的一个内部通用推理模型。

没有专门的数学框架，没有人工设计的推理链，没有逐步的人类引导——只有一张问题陈述。

模型返回了一个证明。

证明的核心结论是：存在一种 n 个点的平面配置，使得恰好 1 单位距离的点对数量至少达到 n^(1+δ)，其中 δ 是某个固定的正指数。

这推翻了 Erdős 的猜想。不是改进了上界，是从根本上证明了 Erdős 想象中的"接近线性"是错的，单位距离对的数量可以超越那个边界。

证明的方法是把代数数论和具体几何问题连接起来，把平面点集的距离问题转化成了数论中某种代数结构的计数问题。OpenAI 随后邀请了一组外部数学家独立验证，对方确认证明是正确的，并撰写了配套的解读论文，专门解释证明的背景和论证结构。

这次和以前的 AI 数学工作有什么不一样

过去几年，AI 在数学上的进展已经有了几个值得注意的节点：

AlphaGeometry（2024） 能在奥数几何题上达到金牌水平，但它用的是神经网络加形式化符号系统的混合架构，整套推理框架是人工设计的，AI 在其中负责填充具体步骤。

AlphaProof（2024） 可以证明奥数中的竞赛题，也是在形式化证明语言（Lean）的框架里工作，问题被提前"翻译"成机器可操作的格式，证明过程由人类研究者选定。

它们很强，但有一个共同特点：人类的介入不只是提问，而是设计了整套工作框架。AI 在其中像一个被放进跑道里的赛马，跑得很快，但跑道是人铺的。

$左侧：AlphaGeometry/AlphaProof 需要人工设计框架+形式化语言+分步引导；右侧：OpenAI 模型直接从自然语言问题输出完整证明$

这次的 OpenAI 模型不同。

它接收的是一段文字描述的数学问题，没有翻译成形式语言，没有人告诉它从哪个方向入手，也没有提供任何中间步骤的提示。它产出的是一段完整的证明，然后交给人类验证。

HN 上一条高赞评论说得很到位：

“Either ‘recombining existing material’ is not disqualifying, or a lot of Fields Medals need to be returned.”

（“要么’重组已有材料’本身不是一种贬低，要么得把很多 Fields 奖奖章收回去。"）

这句话指向一个真正值得思考的问题：我们评价数学发现的标准，到底是什么？

数学家怎么看

Fields 奖得主 Tim Gowers 在看到这个结果后公开表示，这个结果引出了"真正有趣且微妙的问题”——他的措辞是克制的，但 Gowers 向来是这种风格。他没有说"AI 成了数学家"，也没有说"这只是个工具"。

这种克制本身说明了一些事情。

数学界的主流分歧大致是这样的：支持者认为，AI 在这道题上展示了跨域知识连接能力，把代数数论和平面几何拉到同一个框架里，这本身不是一件容易的事，哪怕对人类数学家也不是。反对者说，现有模型是"插值机器"，只能在训练数据的隐含模式里打转，难以实现真正的范式突破，比如微积分或广义相对论那种级别的飞跃。

两种看法都有道理，但有一点正在变得难以否认：那种"大语言模型不可能做出真正的数学发现"的论断，需要重新校准了。

这意味着什么，以及它的边界

先说意义。

这不是 AI 替代数学家的信号，但它确实是一个节点：AI 作为独立提出数学论证的主体，而非单纯的辅助计算工具，已经在这道题上成立了。

对科研工作流来说，这个节点的含义比听起来更具体。如果一个通用推理模型可以接到开放问题、自主探索、产出可验证的证明，那么它在科研中的位置就不再只是"帮我查文献"“帮我写代码”，它开始具备了参与"想问题"本身的可能。

再说边界。

这次的问题，尽管开放了 80 年，仍然属于一类有明确陈述、有清晰验证标准的数学问题。AI 的证明是在一个相对封闭的问题空间里完成的，所用的工具（代数数论、组合几何）都是已知框架。

那些真正改变人类认知底层结构的发现，比如提出一个全新的数学分支，或者察觉到两个毫不相关领域之间的深层联系——这仍然是一个开放的问题。目前没有证据表明现有模型能做到这一点，批评者的这个担忧并不是无理的。

但"能做到哪些"的边界，正在以一种让所有人都很难预测节奏的方式，持续向外扩展。

结尾

有一个细节我觉得值得记下来。

OpenAI 在宣布这个结果的时候，没有大张旗鼓地说"我们的模型解决了 Erdős 问题"。Greg Brockman 的那条推文很简洁，用词很谨慎——“disproved a central conjecture”，而不是"solved mathematics"。

这种克制，和数学界的反应里那种审慎，倒是构成了某种对称。

数学界通常是最不容易被热情感染的群体。如果连 Tim Gowers 都说这个结果引出了"真正有趣且微妙的问题"，大概不是客气话。

参考来源：