OpenAI智能体新线索曝光！网友热议：集成ChatGPT与Operator功能的AI Agent即将登场，基准测试结果令人期待

OpenAI智能体新线索曝光：网友热议“新ChatGPT时刻”即将到来

OpenAI的智能体技术正在迎来新的突破，这一消息引起了广泛关注。根据知名爆料人光头哥的透露，OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项。从曝光的截图来看，这款智能体代号为“Operator（操作员）”，目前正在内测阶段，预计不久将上线。

Operator具备接管用户PC的能力，可以直接替代人类执行一系列任务，如编码开发应用、订餐和制定旅行攻略等。与此同时，OpenAI智能体在多个基准测试中的表现也引起了热议。据数据显示，在多个评估智能体执行自动化任务水平的基准测试中，OpenAI的智能体均超过了竞争对手Claude智能体。

网友们纷纷猜测，这或许意味着下一个“ChatGPT时刻”即将到来。而Windows用户则表达了对跨平台支持的期待，呼吁OpenAI不要仅限于Mac系统。

OpenAI智能体性能对比

光头哥进一步披露了OpenAI智能体与其他竞品的详细对比数据。相关数据显示，OpenAI的智能体在OSWorld和WebArena等多个基准测试中表现出色。例如，在OSWorld这个专为多模态Agent设置的基准测试中，OpenAI的CUA模型得分为38.1%，领先于Anthropic的Computer use功能。而在WebVoyager基准测试中，OpenAI CUA取得了87%的好成绩，不仅领先于Anthropic，还小幅超过了人类的表现（85.3%）。

不过，有辅助的Operator在某些任务上的表现不如完全自主操作的GPT-4o。对此，热心网友指出，两者的主要区别在于一个负责自主操作，另一个则是指导用户完成任务。

此外，关于安全性评估，GPT-4o在拒绝非法宣传、极端活动讨论等方面均为100%，而Operator在越狱、进行非法活动以及禁止的金融活动方面尚未达到100%的安全标准。

2025年：OpenAI重点布局智能体

早在去年11月，彭博社就曾报道OpenAI计划在2025年初推出Operator智能体。如今，这一消息得到了进一步验证。OpenAI CEO奥特曼也在新年目标中明确表示，智能体将成为公司的重要发展方向之一。

上周，OpenAI为ChatGPT推出了新功能「Tasks」，使AI具备了更强大的执行力，可以替用户完成各种任务，包括一次性提醒和重复执行的动作。合理推测，Operator将在这一基础上拥有更多、更强的能力。

随着国内外科技企业对智能体技术的关注不断增加，市场研究公司Markets and Markets预测，到2030年，AI Agent的市场规模有望达到471亿美元。英伟达CEO黄仁勋也在CES上表示，未来公司IT部门将成为Agent人力资源部门，为企业各部门提供新的支持。

无论是企业还是个人，都需紧跟这一趋势，学习和掌握AI Agent技术，迎接即将爆发的智能体时代。

本文来源：