标签：反思

利用OpenAI o1动态思维链与反思技巧，通过语言强化学习和提示技术提升普通LLM的复杂推理能力

近日，一篇关于利用纯提示方法让普通大型语言模型（LLM）具备复杂推理能力的文章在推特上引起了广泛关注。九月份，OpenAI推出了全新的o1系列模型，该模型专攻复杂的推理任务，一经发布便在大模型竞技场上大放异彩。在数学、编程、科学等高难度任务中，o1的表现远超GPT-4和其他人类专家。然而，高昂的使用成本成为了其普及的一大障碍。o1-preview的每百万输入token费用为15美元，每百万输出token费用为60美元，而GPT-4分别为5美元和15美元。为了应对这一问题，有人提出了利用开源代码和特定提示方法来增强普通LLM的推理能力...

来源：

新智元公众号【阅读原文】
Tags：OpenAI o1 动态思维链反思提示技术语言强化学习

5个月前