标签:时间推理

N人工智能大语言模型在时间推理任务上的挑战:时钟识别与日历任务为何难倒AI?

(由多段落组成) 随着人工智能技术的飞速发展,AI 已经能够生成逼真的图像、创作小说,甚至预测蛋白质结构。然而,一项最新的研究发现,这些看似无所不能的 AI 在一项非常基础的任务上却频频出错——那就是读取时间。爱丁堡大学的研究团队测试了七款知名的多模态大语言模型,评估它们通过时钟或日历图像回答时间相关问题的能力。 这项研究将在 4 月正式发布,但目前已在科研共享平台 arXiv 上公开。研究表明,即使是当前最先进的大型语言模型,在处理这种基础任务时也表现不佳。研究人员指出:“从视觉输入中解读时间并进行...