标签：GSM-Symbolic

苹果新论文揭示大型语言模型的逻辑推理能力局限：GSM-Symbolic与数学题挑战

苹果公司最新发布的一篇论文《GSM-Symbolic： Understanding the Limitations of Mathematical Reasoning in Large Language Models》探讨了大型语言模型（LLM）在数学推理方面的局限性。这篇论文由苹果机器学习研究工程师 Iman Mirzadeh 主笔，Samy Bengio 等人共同完成。研究团队通过一系列实验发现，即使是当前最先进的 LLM，如 OpenAI 的 o1-preview，在面对稍微复杂的数学问题时，依然会出现明显的推理错误。研究人员通过具体例子展示了这一现象。例如，当题目中包含无关紧要的细节时，模型往往会被误导。例如，题目...

来源：

机器之心【阅读原文】
Tags：GSM-Symbolic 大型语言模型数学推理苹果论文逻辑推理能力

6个月前