DeepMind AI 在 2024 年国际数学奥林匹克竞赛中荣获银牌

Gábor Bíró 2024年7月31日
3 阅读时间

谷歌DeepMind的AI系统 достигли значительного рубежа,在2024年国际数学奥林匹克竞赛(IMO)中取得了银牌级别的成绩。该公司的专业模型AlphaProof和AlphaGeometry 2成功解决了这项著名赛事中六道难题中的四道, 展示了 人工智能在解决复杂数学问题方面日益增长的能力。

DeepMind AI 在 2024 年国际数学奥林匹克竞赛中荣获银牌
来源: 作者原创

AlphaProof 和 AlphaGeometry 2

谷歌DeepMind开发了两个专门的AI系统来解决复杂的数学问题。AlphaProof结合了预训练语言模型和AlphaZero强化学习算法,使其能够解决和证明代数和数论中的问题。AlphaGeometry 2是其前身版本的增强版,专注于几何问题,并在包含1亿个合成示例的庞大数据集上进行了训练。这种创新的数据生成方法有助于克服人工编写的训练数据稀缺的问题,而这通常是AI在数学推理任务开发中面临的障碍。

AlphaProof 和 AlphaGeometry 2 的训练方法

AlphaProof 和 AlphaGeometry 2 采用了创新的训练方法,以实现其令人印象深刻的数学推理能力。AlphaProof 使用了一种自我博弈的方法,在几周内解决了数百万个不同难度级别和数学主题的问题。它生成候选解,并在 Lean 形式化语言中搜索证明步骤,从而通过每个经过验证的证明来强化其语言模型。AlphaGeometry 2 在此基础上进行了扩展,集成了在包含 1 亿个合成示例的更大数据集上训练的 Gemini 语言模型。为了弥合自然语言和形式化语言之间的差距,研究人员微调了一个 Gemini 模型,将自然语言问题陈述翻译成形式化数学语言,创建了一个庞大的形式化问题库。这种方法使系统能够应对各种数学挑战。

2024 年国际数学奥林匹克竞赛 (IMO) 的表现

在 2024 年国际数学奥林匹克竞赛中,AlphaProof 成功解决了两道代数题和一道数论题,而 AlphaGeometry 2 解决了一道几何题。它们的综合解决方案总共获得了 42 分中的 28 分,相当于银牌水平,仅比金牌门槛低一分。值得注意的是,AlphaGeometry 2 仅用 19 秒就解决了它的问题,展示了其卓越的效率。这些问题被手动翻译成形式化数学语言供 AI 系统使用,而解决方案的生成时间从几分钟到三天不等。

成就的意义

这一里程碑代表着 AI 在处理复杂数学推理能力方面向前迈出了重要一步,而这在以前对机器来说是一项具有挑战性的任务。AlphaProof 和 AlphaGeometry 2 的成功表明,AI 现在可以执行解决国际数学奥林匹克竞赛 (IMO) 问题所需的高级逻辑推理、抽象和分层规划。尤其值得注意的是,AI 系统生成了人类可读的证明,并使用了类似于人类参赛者的经典几何规则。这一成就得到了包括菲尔兹奖得主蒂莫西·高尔斯在内的数学专家的认可,他对 AI 找到解决复杂问题的“魔力钥匙”的能力表示惊讶。这些系统的性能接近人类金牌得主的水平,AlphaGeometry 2 解决了过去 25 年中 83% 的历史国际数学奥林匹克竞赛 (IMO) 几何问题,这比其前身 53% 的成功率有了显着提高。

AI 在数学领域的未来潜力

AlphaProof 和 AlphaGeometry 2 在国际数学奥林匹克竞赛 (IMO) 中的成功表现为 AI 辅助数学研究和问题解决开辟了新的可能性。这些系统可能有助于数学家发现新的见解、解决未解决的问题并加速科学发现。与此同时,DeepMind 的研究人员承认,AI 仍然缺乏人类数学家的创造力和解决问题的直觉,这表明需要进一步开发 AI 才能完全匹敌人类在数学方面的能力。随着这些系统的不断发展,它们可能会成为强大的计算工具,类似于计算器,协助人类制定数学证明和探索复杂的假设。

Gábor Bíró 2024年7月31日