OpenAI智能体新线索曝光!网友热议:集成ChatGPT与Operator功能的AI Agent即将登场,基准测试结果令人期待

OpenAI智能体新线索曝光:网友热议“新ChatGPT时刻”即将到来

OpenAI的智能体技术正在迎来新的突破,这一消息引起了广泛关注。根据知名爆料人光头哥的透露,OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项。从曝光的截图来看,这款智能体代号为“Operator(操作员)”,目前正在内测阶段,预计不久将上线。

Operator具备接管用户PC的能力,可以直接替代人类执行一系列任务,如编码开发应用、订餐和制定旅行攻略等。与此同时,OpenAI智能体在多个基准测试中的表现也引起了热议。据数据显示,在多个评估智能体执行自动化任务水平的基准测试中,OpenAI的智能体均超过了竞争对手Claude智能体。

网友们纷纷猜测,这或许意味着下一个“ChatGPT时刻”即将到来。而Windows用户则表达了对跨平台支持的期待,呼吁OpenAI不要仅限于Mac系统。

OpenAI智能体性能对比

光头哥进一步披露了OpenAI智能体与其他竞品的详细对比数据。相关数据显示,OpenAI的智能体在OSWorld和WebArena等多个基准测试中表现出色。例如,在OSWorld这个专为多模态Agent设置的基准测试中,OpenAI的CUA模型得分为38.1%,领先于Anthropic的Computer use功能。而在WebVoyager基准测试中,OpenAI CUA取得了87%的好成绩,不仅领先于Anthropic,还小幅超过了人类的表现(85.3%)。

不过,有辅助的Operator在某些任务上的表现不如完全自主操作的GPT-4o。对此,热心网友指出,两者的主要区别在于一个负责自主操作,另一个则是指导用户完成任务。

此外,关于安全性评估,GPT-4o在拒绝非法宣传、极端活动讨论等方面均为100%,而Operator在越狱、进行非法活动以及禁止的金融活动方面尚未达到100%的安全标准。

2025年:OpenAI重点布局智能体

早在去年11月,彭博社就曾报道OpenAI计划在2025年初推出Operator智能体。如今,这一消息得到了进一步验证。OpenAI CEO奥特曼也在新年目标中明确表示,智能体将成为公司的重要发展方向之一。

上周,OpenAI为ChatGPT推出了新功能「Tasks」,使AI具备了更强大的执行力,可以替用户完成各种任务,包括一次性提醒和重复执行的动作。合理推测,Operator将在这一基础上拥有更多、更强的能力。

随着国内外科技企业对智能体技术的关注不断增加,市场研究公司Markets and Markets预测,到2030年,AI Agent的市场规模有望达到471亿美元。英伟达CEO黄仁勋也在CES上表示,未来公司IT部门将成为Agent人力资源部门,为企业各部门提供新的支持。

无论是企业还是个人,都需紧跟这一趋势,学习和掌握AI Agent技术,迎接即将爆发的智能体时代。

本文来源: 量子位【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...