16年老程序员当场“退休”，OpenAI o1这么强吗？

近日，OpenAI发布了最新的AI模型——o1-preview，这款模型在科学、编程及数学等领域展现了卓越的能力。此外，他们还推出了一款更加轻量级的版本——o1-mini，不仅效率更高，而且成本更低。

二、o1模型的强大功能

o1模型通过强化学习训练而成，其幻觉频率显著低于GPT-4，并且在数学和代码能力上分别提升了6倍和8倍。在一系列高难度基准测试中，o1的表现超越了人类博士水平，特别是在物理和生物领域的问答环节中。

三、用户反响与体验

OpenAI CEO Sam Altman宣布，o1-preview现已对ChatGPT Plus和Team用户开放，而o1-mini则计划向所有免费用户开放。不少用户在试用后表示，o1在复杂逻辑推理方面的表现令人惊叹。例如，在国际数学奥林匹克竞赛资格选拔的AIME考试中，o1的准确率高达83%，远超GPT-4o的13%。

四、o1的实际应用案例

一名拥有16年全栈开发经验的程序员尝试用o1编写代码，结果发现o1能快速生成全栈原生应用程序的代码。此外，还有网友将o1与编程神器Cursor结合，在短时间内创建了一个iOS天气应用程序。尽管如此，o1在某些简单问题上的表现仍有待提高。

五、o1的局限性与未来展望

尽管o1在多个领域表现出色，但它仍然是一款纯文本模型，缺乏多模态功能。此外，o1的定价较高，对于开发者而言，o1-preview的价格远高于GPT-4o。总体而言，GPT-4o仍然是OpenAI目前最强大的模型。然而，人们依然对即将到来的GPT-5充满期待。

本文来源：