OpenAI的「草莓项目」揭秘：强化推理能力，后训练技术引领AGI路线图新里程

OpenAI近期被曝光了一个名为“草莓”的新项目，该项目具有前瞻性的规划能力，能够自主浏览网页并进行深度研究。草莓模型经过大规模通用数据的后期训练，提升了推理能力，据信已达到OpenAI AGI路线图中的Level 2级别。尽管内部文件显示OpenAI正在全力研发，但Strawberry的具体运作方式仍处于高度保密状态，发布时间未知。有消息称，Strawberry与去年的Q*项目有关，后者在OpenAI内部已取得突破。该模型旨在增强AI的推理能力，使其不仅限于提供查询答案，还能进行自主的决策和研究。OpenAI期望Strawberry的创新能够显著提升AI模型的推理能力，以实现更高级别的智能。目前，包括谷歌、Meta和微软在内的科技巨头也在探索改进AI推理能力的方法。

Strawberry采用了特殊的“后训练”技术，即在AI模型初步训练后，对其进行特定优化以提升性能。这一方法类似于斯坦福大学的“自我教导推理者”（STaR），允许AI通过自我迭代提升智能水平。此外，Strawberry有望执行长时间任务（LHT），在复杂任务中进行提前规划和长时间执行。OpenAI计划测试其在软件工程和机器学习领域的应用。最近，OpenAI内部展示了一个展示人类级别推理能力的神秘项目，外界猜测可能与Strawberry有关。OpenAI的AGI路线图表明，他们正在逐步迈向能够解决博士级问题的“推理者”阶段。

本文来源：