标签:数学理解

AI大模型困惑:数学理解挑战,9.11与9.9的大小常识判断,通用人工智能的Prompt工程难题

在编程领域,一些程序员可能会本能地认为9.11大于9.9,但这仅仅是在特定场景下。然而,当向AI大模型提出这个问题时,答案却五花八门,甚至出现了一些“失误”。Riley Goodside,一位在Scale AI工作的staff prompt engineer,通过推文分享了他发现的有趣现象。他向多个大模型输入“9.11and9.9- which is bigger?”,结果ChatGPT4o和Gemini Advanced等模型给出了错误的答案。尽管Claude3.5Sonnet在解释过程中差点回答正确,但最终还是陷入了误区。 这个问题引发了一场关于AI模型在基础数学理解上的讨论,有人提到了《歌手2024》排...

当AI与数学同时走下神坛

2024年阿里巴巴全球数学竞赛引入了人工智能参赛者,与人类选手同台竞技。这场独特的比赛吸引了全球数万名数学爱好者,其中包括17岁获得IMO满分的北大天才、执着于数学的博士以及早慧的渐冻症少年。今年,563个AI模型也参与其中,使用token答题,打破了以往的竞赛模式。尽管AI并未超越人类得分,但它们的答案揭示了AI在数学领域的潜在应用。参赛者中,如中学生朱方圆,利用ChatGPT等生成式AI,通过心理疏导和激励提升AI答题成功率。另一位中学生涂津豪则采用大模型对话的方式迭代答案。最终,AI最高分仅为34分,无人晋级决赛...