标签：数学理解

AI大模型困惑：数学理解挑战，9.11与9.9的大小常识判断，通用人工智能的Prompt工程难题

在编程领域，一些程序员可能会本能地认为9.11大于9.9，但这仅仅是在特定场景下。然而，当向AI大模型提出这个问题时，答案却五花八门，甚至出现了一些“失误”。Riley Goodside，一位在Scale AI工作的staff prompt engineer，通过推文分享了他发现的有趣现象。他向多个大模型输入“9.11and9.9- which is bigger?”，结果ChatGPT4o和Gemini Advanced等模型给出了错误的答案。尽管Claude3.5Sonnet在解释过程中差点回答正确，但最终还是陷入了误区。这个问题引发了一场关于AI模型在基础数学理解上的讨论，有人提到了《歌手2024》排...

来源：

CSDN公众号【阅读原文】
Tags：AI大模型 Prompt工程常识判断数学理解通用人工智能

9个月前

当AI与数学同时走下神坛

2024年阿里巴巴全球数学竞赛引入了人工智能参赛者，与人类选手同台竞技。这场独特的比赛吸引了全球数万名数学爱好者，其中包括17岁获得IMO满分的北大天才、执着于数学的博士以及早慧的渐冻症少年。今年，563个AI模型也参与其中，使用token答题，打破了以往的竞赛模式。尽管AI并未超越人类得分，但它们的答案揭示了AI在数学领域的潜在应用。参赛者中，如中学生朱方圆，利用ChatGPT等生成式AI，通过心理疏导和激励提升AI答题成功率。另一位中学生涂津豪则采用大模型对话的方式迭代答案。最终，AI最高分仅为34分，无人晋级决赛...

来源：

硅星人Pro公众号【阅读原文】
Tags：AI 人类与AI竞技数学理解生成式AI 阿里巴巴全球数学竞赛

10个月前