谷歌DeepMind在国际数学奥林匹克竞赛中荣获银牌!AlphaProof和AlphaGeometry 2展现人工智能数学推理实力,第四题解答仅耗时19秒
近期,谷歌DeepMind宣布了一项重大成就:其开发的人工智能系统在国际数学奥林匹克竞赛(IMO)中获得了银牌,且仅以一分之差未能摘得金牌。这项成绩引起了广泛关注,不仅因为IMO是全球最具挑战性的数学竞赛之一,还因为它标志着人工智能在解决复杂数学问题上的巨大进步。
谷歌AI挑战IMO
在这次竞赛中,谷歌AI成功解决了2024年IMO的六道题目中的四道,总分达到了28分(满分42分)。尤其值得注意的是,在解决第四题几何问题时,AI仅用了短短19秒。而被认为是本次竞赛中最难的第六题,AI同样给出了正确的解答,今年只有五位参赛者能够完成这道题目。
技术揭秘:AlphaProof与AlphaGeometry 2
这次取得优异成绩的AI系统由两个关键部分组成:AlphaProof和AlphaGeometry 2。AlphaProof是一款基于强化学习的形式数学推理系统,能够通过形式语言Lean来证明数学陈述。它结合了预训练的语言模型与AlphaZero强化学习算法,能够在面对新问题时快速生成解决方案,并通过不断的训练循环来提升自己的能力。
AlphaGeometry 2则是AlphaGeometry的升级版,专注于解决几何问题。相比之前的版本,它使用了更大规模的数据集进行训练,并采用了更快的符号引擎。此外,它还引入了一种新的知识共享机制,使得系统能够更好地处理复杂问题。在正式比赛之前,AlphaGeometry 2就已经能够解决过去25年所有IMO几何问题中的83%,显著提高了解决问题的效率。
比赛过程
在比赛中,问题首先被手动翻译成正式的数学语言,以便系统理解。AlphaProof解决了两道代数题和一道数论题,包括被认为是最难的第六题。AlphaGeometry 2则专注于解决几何问题。尽管这两个系统未能解决两道组合问题,但它们的整体表现仍然令人印象深刻。
本文来源: 量子位【阅读原文】