OpenAI首次直播震撼登场,最强推理模型o1满血版上线,月费高达1450元
来源:量子位
2024-12-06 04:36:08
在“双十二”购物节的第一天,OpenAI以一场震撼的直播拉开了序幕,发布了其最强推理模型o1的满血版及其Pro版本。同时,ChatGPT也推出了Pro订阅计划,月费高达200美元,成为全球最昂贵的语言模型之一。
CEO山姆·阿尔特曼与几位团队成员围坐在桌前,向观众展示了新产品的强大功能。整个发布会虽然只有短短15分钟,但信息量巨大,令人印象深刻。
与之前的预览版相比,满血版o1在数学和代码能力方面有了显著提升,Pro版本更是将这一优势推向了新的高度。满血版的推理速度提升了60%,并且支持多模态推理,具备强大的视觉理解能力。
满血版o1已经正式上线ChatGPT,预览版则从用户界面中消失。Pro版本则是ChatGPT Pro订阅用户的专属特权,这些用户可以无限次使用满血版o1。
在演示环节中,团队首先对比了满血版o1和预览版的性能。通过一个历史问题的测试,满血版o1仅用了14秒就完成了回答,而预览版则需要33秒。多次测试结果显示,满血版o1的平均响应速度比预览版快了60%。
此外,满血版o1在推理时犯重大错误的频率降低了34%,这得益于OpenAI进行的一系列人类评估。满血版o1还支持多模态输入,具备视觉推理能力。团队在现场展示了一个数据中心草图的推理任务,满血版o1迅速给出了详细的解答,甚至在缺少某个参数的情况下也能准确推理出正确答案。
Pro版本的表现同样令人惊叹。团队测试了一些高难度的生物化学问题,这些问题在预览版中无法解决,但在Pro模式下,模型仅用了53秒就给出了答案,并且详细记录了推理过程。
尽管Pro版本的月费高达200美元,但其强大的功能和卓越的性能无疑使其成为专业人士的首选。未来,OpenAI还将通过API形式提供更多功能,包括结构化输出、函数调用和图像API等。
发布会结束后,阿尔特曼还特意请来一位嘉宾讲述了一个关于圣诞老人和大语言模型的笑话,引发了现场一阵笑声。
在技术报告中,OpenAI详细介绍了o1在数学、代码和博士级科学问答方面的表现。此外,报告还强调了o1的安全性,经过内部和红队测试,满血版o1在有害的检测和拒绝能力方面表现更为出色。
最后,团队透露了一些有趣的信息。例如,从ChatGPT的JS代码中提前发现了Pro版本的线索,以及网友利用Grok预测OpenAI未来发布的产品。未来几天内,OpenAI是否还会带来更多惊喜,值得期待。
本文来源: 量子位【阅读原文】