OpenAI 再次给大模型 “泡沫” 续命

引言

近期,OpenAI 发布了备受瞩目的 o1 模型,这一新产品引起了广泛关注。与此同时,作为人工智能领域的领头羊,英伟达的股价在短短两天内上涨了 10%。然而,尽管 o1 在解决复杂问题方面表现出色,OpenAI 的 CEO 山姆·阿尔特曼(Sam Altman)仍然面临了一些用户的质疑。

用户反馈与期待

在阿尔特曼宣布 o1 上线的推文下,一条评论迅速引起了他的注意:“什么时候能用上新的语音功能?”阿尔特曼回应道:“能否先花些时间感谢这项神奇的技术,再期待新功能?”实际上,用户们一直在期待 OpenAI 于今年 5 月承诺的 GPT-4o 端到端语音功能。当时演示的 AI 语音自然流畅,几乎难以分辨真假。按照计划,数百万 ChatGPT 付费用户应在几周内用上这项功能,但至今仍未实现。

技术发展与挑战

过去一年,OpenAI 的产品进度一直被视作“期货”。虽然 GPT-4 已上线一年多,但 GPT-5 仍未发布。年初发布的视频模型 Sora 也未大规模开放。这些延迟不仅影响了用户信心,也让资本市场对 AI 大模型的前景产生了质疑。一些中国科技巨头和大模型公司暂停了基础模型的训练,转而将更多资源投入到应用开发或对外出租 GPU 算力。他们担心技术进步空间有限,开始减少投入,寻求回报。

新模型的特点

OpenAI 的 o1 不仅在编程、数学等领域表现出色,还在推理过程中展现了强大的逻辑能力。与之前的模型相比,o1 在训练过程中分配了更多算力用于“思考”,而不是单纯依赖大量的数据训练。这种变化打破了原有的 Scaling Laws 瓶颈,显著提升了模型的推理能力。此外,o1-mini 还展示了在高价值垂直领域开发高性能模型的潜力。

强化学习思维链

o1 的训练采用了强化学习和思维链技术。通过强化学习,o1 学会了自我纠偏,并将复杂问题分解为简单步骤。例如,o1 在回答一个 bash 脚本问题时,将问题拆解成一系列小步骤,逐步推理得出答案。这种训练方法使得 o1 在编程和数学问题上的表现远超 GPT-4o。

算力需求与市场反响

尽管 o1 在推理能力上表现出色,但它也带来了更高的算力需求。用户使用 o1-preview 和 o1-mini 的次数受到严格限制,相比之下,GPT-4o 的使用频率则宽松得多。o1 回答问题的时间也显著增加,处理的文本量更大,这意味着更高的算力成本。然而,o1 的发布再次激发了市场对 AI 技术的信心,英伟达的股价也随之回升。

未来展望

o1 的发布为大模型的发展指明了新方向,也暗示了算力需求将进一步提升。无论是 o1 成为主流方法,还是与 GPT 系列结合,未来的模型都将更加注重推理能力。随着技术的进步,新一轮的竞争和投入即将展开。

本文来源: iFeng科技【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...