OpenAI震撼发布:10款全新模型Demo展示人工智能技术巅峰,网友热议代码生成与常识推理能力

OpenAI 发布 o1 大模型:革新推理能力

9月13日凌晨,OpenAI 发布了全新的 o1 系列模型,这一模型在社交媒体上引起了广泛的关注。o1 模型无需专门训练,即可在复杂的数学竞赛和博士级别的科学问答中表现出色。然而,这种强大的推理能力是以牺牲响应速度为代价的。o1 在回答问题前会经历一个较长的内部思维链,这使得其推理任务的表现更为出色。

o1 模型的应用实例

为了展示 o1 的强大功能,OpenAI 公布了十个演示视频:

1. 编写“找松鼠”游戏代码
OpenAI 研究员 Jason Wei 让 o1 编写了一个名为“找松鼠”的视频游戏代码。尽管模型思考了21秒,但它成功生成了完整的游戏代码。通过简单的操作,游戏可以顺利运行。

2. 贪吃蛇游戏
研究员 Hongyu Ren 使用 o1 制作了一个经典的贪吃蛇小游戏。o1 生成了详细的代码,使得游戏界面美观且易于控制。此外,Hongyu Ren 还增加了难度,使游戏中的障碍物形成“AI”字样。

3. 常识性推理
OpenAI 研究主管 Jerry Tworek 展示了一个涉及物理常识的推理问题:草莓在倒置的杯子放进微波炉后的位置。o1 成功解释了这一现象,并给出了合理的推理步骤。

4. 解答脑筋急转弯
Jerry Tworek 还展示了 o1 解答复杂逻辑题的能力。面对一道复杂的年龄问题,o1 不仅给出了正确答案,还详细解释了解题步骤。

5. 单词“strawberry”中的“r”数量
OpenAI 研究员测试了 o1 对单词的理解能力。与之前的 GPT-4o 相比,o1 成功回答了“strawberry”中有几个“r”,展现了其出色的推理和校验能力。

6. 解决数织题
研究员 Mason Meyer 让 o1 生成并解答一个数织题。o1 不仅成功生成了谜题,还正确解答了它,并遵循了指定的要求。

7. 创作六行诗
Jason Wei 让 o1 根据特定要求创作一首六行诗。o1 生成的诗歌不仅符合所有限制条件,而且质量远高于 GPT-4o 的输出。

8. 编写代码
OpenAI 展示了 o1 编写代码的能力。演示者用 o1 编写了一个展示 Transformer 自注意力机制的交互效果网页,o1 生成的代码准确无误。

网友的反响

o1 新模型一经发布,全球网友纷纷尝试各种应用场景。例如,Eleven Labs 的设计主管 Ammaar Reshi 仅用了10分钟便用 o1 和 Cursor 创建了一个完整的 iOS 天气应用程序。尽管 o1 的思考时间较长,但其强大的功能令人惊叹。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...