数学正在经历其历史上最大的变革,AI重新定义数学家这份职业
发布时间:2026-03-11 17:03 浏览量:3
一年前,多伦多大学数学家丹尼尔·利特还信心满满地打了个赌:到2030年,AI有75%的概率无法写出一篇达到顶尖数学家水平的论文。
一年后,他在博客上坦承,自己很可能会输掉这场赌局。
利特的转变,是整个数学界过去两年集体情绪的缩影。AI的数学能力正在以一种让专业人士目瞪口呆的速度跃升,从连高中题都答不利落,到在国际数学奥林匹克竞赛中拿下金牌,这条曲线陡得几乎不像真的。
2024年,谷歌DeepMind的AlphaProof和AlphaGeometry 2组合出战国际数学奥林匹克竞赛(IMO),以银牌水准完赛,仅差一分摘金,已经震动了整个数学界。
到2025年夏天,局面彻底改变。谷歌搭载深度思考能力的Gemini在当年IMO正式赛场上达到金牌分数线,OpenAI的o3模型同样取得了金牌水准的成绩。同一年,DeepMind在《自然》杂志发表论文,展示了AlphaProof在历届IMO题库中的完整表现,其推理深度让评审专家感到"不像是机器写的"。
要知道,IMO的题目并非简单的计算,它需要参赛者从零构建证明逻辑,往往需要创造性的洞察,而不是套公式。能在这个舞台上拿金牌,意味着AI已经跨越了一道长期被认为"机器难以逾越"的认知门槛。
但奥数金牌之外,还有一片更广阔、更难征服的领域,那就是真正的数学研究。
Epoch AI在2024年底推出了一套名为FrontierMath的基准测试,题目全部来自尚未发表的原创研究级数学问题,由多位顶尖数学家亲自出题,并承诺题目不会流入任何训练数据集。测试刚推出时,最好的AI模型解题率不足2%,这个数字让很多人暂时松了口气。
然而好景不长。到2025年底,随着新一代推理模型的迭代,FrontierMath的解题率已经开始显著攀升,Epoch AI自己也承认,"AI在数学上进步的速度,几乎和我们写出新测试题的速度一样快。"
数学界反应最敏锐的声音之一,来自被公认为当世最伟大在世数学家的陶哲轩。
他早在2023年就预判,2026年水平的AI将能够胜任"可靠的初级合作者"角色,尤其擅长处理繁琐的验证工作、枚举案例和形式化证明。如今这一时间节点已经到来,他的判断正在被现实一一印证。陶哲轩本人已经公开将AI工具引入自己的研究流程,并表示AI极大地降低了将数学直觉转化为严格证明的摩擦成本。
更具体的案例来自2025年的几项研究成果。AI辅助工具帮助数学家在Lean形式化证明系统中验证了若干此前手工验证极为困难的定理,将原本需要数月的验证工作压缩到数天。与此同时,基于强化学习的AI系统独立解决了长期悬而未决的安德鲁斯-柯蒂斯猜想的部分案例,这是一个困扰组合群论研究者超过60年的难题。
这些进展让数学界开始认真讨论一个以前被认为是遥远未来才需要面对的问题:当AI能够独立完成越来越多的证明工作,数学家的核心价值究竟是什么?
目前主流的答案,指向了问题的提出而非问题的解决。好的数学研究需要判断哪些问题值得研究,哪些方向可能打开新的理论空间,这种元层面的判断力,依然是人类数学家的核心竞争力。但这条边界,同样在移动。
利特在博客中写道,他如今会把AI看作一个"非常聪明但缺乏直觉"的合作者,有时候它的建议令人惊喜,有时候它的错误也令人沮丧。
这大概就是数学界和AI共处的新常态:不是取代,而是一场还没有人完全看清终点的深度重构。