标签：ARC-AGI基准

Ryan Greenblatt的GPT-4o打破通用人工智能ARC-AGI基准，实现71%新高，证明LLMs学习能力里程碑式突破！

【新智元报道】近日，AI领域传来重大突破，GPT-4o模型在ARC-AGI基准测试中取得了前所未有的成绩，打破了之前无人能及的纪录。ARC-AGI，作为评估通用人工智能的重要标准，由François Chollet设计，被认为很难被轻易超越。然而，GPT-4o在公共测试集上的准确率达到了50%，在训练集的保留子集上更是高达71%，一举成为新的SOTA！这个基准测试自2020年起在Kaggle平台上举办，当年的冠军团队icecuber在测试集上的成功率仅为21%，证明了ARC-AGI的挑战性。然而，GPT-4o的表现打破了这一局面，标志着通用AI的进步迈出了重要一步。此...

来源：

9个月前