标签:ARC-AGI基准
Ryan Greenblatt的GPT-4o打破通用人工智能ARC-AGI基准,实现71%新高,证明LLMs学习能力里程碑式突破!
【新智元报道】近日,AI领域传来重大突破,GPT-4o模型在ARC-AGI基准测试中取得了前所未有的成绩,打破了之前无人能及的纪录。ARC-AGI,作为评估通用人工智能的重要标准,由François Chollet设计,被认为很难被轻易超越。然而,GPT-4o在公共测试集上的准确率达到了50%,在训练集的保留子集上更是高达71%,一举成为新的SOTA! 这个基准测试自2020年起在Kaggle平台上举办,当年的冠军团队icecuber在测试集上的成功率仅为21%,证明了ARC-AGI的挑战性。然而,GPT-4o的表现打破了这一局面,标志着通用AI的进步迈出了重要一步。此...