OpenAI的「草莓项目」揭秘:强化推理能力,后训练技术引领AGI路线图新里程

OpenAI近期被曝光了一个名为“草莓”的新项目,该项目具有前瞻性的规划能力,能够自主浏览网页并进行深度研究。草莓模型经过大规模通用数据的后期训练,提升了推理能力,据信已达到OpenAI AGI路线图中的Level 2级别。尽管内部文件显示OpenAI正在全力研发,但Strawberry的具体运作方式仍处于高度保密状态,发布时间未知。有消息称,Strawberry与去年的Q*项目有关,后者在OpenAI内部已取得突破。该模型旨在增强AI的推理能力,使其不仅限于提供查询答案,还能进行自主的决策和研究。OpenAI期望Strawberry的创新能够显著提升AI模型的推理能力,以实现更高级别的智能。目前,包括谷歌、Meta和微软在内的科技巨头也在探索改进AI推理能力的方法。

Strawberry采用了特殊的“后训练”技术,即在AI模型初步训练后,对其进行特定优化以提升性能。这一方法类似于斯坦福大学的“自我教导推理者”(STaR),允许AI通过自我迭代提升智能水平。此外,Strawberry有望执行长时间任务(LHT),在复杂任务中进行提前规划和长时间执行。OpenAI计划测试其在软件工程和机器学习领域的应用。最近,OpenAI内部展示了一个展示人类级别推理能力的神秘项目,外界猜测可能与Strawberry有关。OpenAI的AGI路线图表明,他们正在逐步迈向能够解决博士级问题的“推理者”阶段。

本文来源: ​新智元公众号【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...