标签:Prompt工程

AI大模型困惑:数学理解挑战,9.11与9.9的大小常识判断,通用人工智能的Prompt工程难题

在编程领域,一些程序员可能会本能地认为9.11大于9.9,但这仅仅是在特定场景下。然而,当向AI大模型提出这个问题时,答案却五花八门,甚至出现了一些“失误”。Riley Goodside,一位在Scale AI工作的staff prompt engineer,通过推文分享了他发现的有趣现象。他向多个大模型输入“9.11and9.9- which is bigger?”,结果ChatGPT4o和Gemini Advanced等模型给出了错误的答案。尽管Claude3.5Sonnet在解释过程中差点回答正确,但最终还是陷入了误区。 这个问题引发了一场关于AI模型在基础数学理解上的讨论,有人提到了《歌手2024》排...