OpenAI 再次给大模型 “泡沫” 续命

引言

近期，OpenAI 发布了备受瞩目的 o1 模型，这一新产品引起了广泛关注。与此同时，作为人工智能领域的领头羊，英伟达的股价在短短两天内上涨了 10%。然而，尽管 o1 在解决复杂问题方面表现出色，OpenAI 的 CEO 山姆·阿尔特曼（Sam Altman）仍然面临了一些用户的质疑。

用户反馈与期待

在阿尔特曼宣布 o1 上线的推文下，一条评论迅速引起了他的注意：“什么时候能用上新的语音功能？”阿尔特曼回应道：“能否先花些时间感谢这项神奇的技术，再期待新功能？”实际上，用户们一直在期待 OpenAI 于今年 5 月承诺的 GPT-4o 端到端语音功能。当时演示的 AI 语音自然流畅，几乎难以分辨真假。按照计划，数百万 ChatGPT 付费用户应在几周内用上这项功能，但至今仍未实现。

技术发展与挑战

过去一年，OpenAI 的产品进度一直被视作“期货”。虽然 GPT-4 已上线一年多，但 GPT-5 仍未发布。年初发布的视频模型 Sora 也未大规模开放。这些延迟不仅影响了用户信心，也让资本市场对 AI 大模型的前景产生了质疑。一些中国科技巨头和大模型公司暂停了基础模型的训练，转而将更多资源投入到应用开发或对外出租 GPU 算力。他们担心技术进步空间有限，开始减少投入，寻求回报。

新模型的特点

OpenAI 的 o1 不仅在编程、数学等领域表现出色，还在推理过程中展现了强大的逻辑能力。与之前的模型相比，o1 在训练过程中分配了更多算力用于“思考”，而不是单纯依赖大量的数据训练。这种变化打破了原有的 Scaling Laws 瓶颈，显著提升了模型的推理能力。此外，o1-mini 还展示了在高价值垂直领域开发高性能模型的潜力。

强化学习与思维链

o1 的训练采用了强化学习和思维链技术。通过强化学习，o1 学会了自我纠偏，并将复杂问题分解为简单步骤。例如，o1 在回答一个 bash 脚本问题时，将问题拆解成一系列小步骤，逐步推理得出答案。这种训练方法使得 o1 在编程和数学问题上的表现远超 GPT-4o。

算力需求与市场反响

尽管 o1 在推理能力上表现出色，但它也带来了更高的算力需求。用户使用 o1-preview 和 o1-mini 的次数受到严格限制，相比之下，GPT-4o 的使用频率则宽松得多。o1 回答问题的时间也显著增加，处理的文本量更大，这意味着更高的算力成本。然而，o1 的发布再次激发了市场对 AI 技术的信心，英伟达的股价也随之回升。

未来展望

o1 的发布为大模型的发展指明了新方向，也暗示了算力需求将进一步提升。无论是 o1 成为主流方法，还是与 GPT 系列结合，未来的模型都将更加注重推理能力。随着技术的进步，新一轮的竞争和投入即将展开。

本文来源：