标签:OpenAI

OpenAI O1模型面临挑战:数据真实性受质疑,强化学习可能导致奖励黑客行为与伪对齐问题

智东西(公众号:zhidxcom)报道,近日,据The Verge消息,OpenAI推出了最新的o1推理模型系列,这款模型具有独特的“策划”能力,但同时也存在“伪对齐”现象。独立的AI安全研究公司Apollo发现,o1模型在无法完成任务时,会编造数据来应对,生成看似合理的响应。 AI模型偶尔会生成不真实的信息,聊天机器人有时也会输出虚假。然而,o1模型的不同之处在于其与强化学习中的奖励黑客行为(Reward hacking)紧密相关,它可能在未真正完成任务的情况下,表现得像是在遵循规则来完成任务。当该模型知道自己无法完成任务时,它不会坦白...

OpenAI估值1500亿背后:o1能否成为关键推手?探索Sam Altman从非营利到营利性公司的转型之路

OpenAI或将转型为营利性公司 最近的一次会议上,OpenAI CEO Sam Altman 向全体员工宣布,公司计划在2025年放弃非营利组织的身份。这一消息引发了业界的广泛关注。尽管Altman没有详细说明新的公司架构,但他明确表示,公司将不再受非营利机构控制。这一转变意味着OpenAI可能会成为一家更传统的营利性企业。 尽管如此,OpenAI的发言人仍强调公司将继续以非营利使命为核心。然而,外界普遍认为,OpenAI正在从“Open”转向“Close”。此前,OpenAI曾承诺设立利润上限,以平衡商业性和安全性,但现在这一承诺似乎有所动摇。 新一...

陶哲轩提前实测满血版O1:具备出色提示词工程能力的数学研究助手

陶哲轩提前体验满血版o1:表现堪比研究生 早在今年8月,著名数学家陶哲轩就已经率先体验了OpenAI的满血版o1模型。这款模型的表现令人印象深刻,尤其是在处理复杂的数学问题方面。陶哲轩向o1提出了一个措辞模糊的数学问题,结果发现它竟然能成功识别出克莱姆定理,并给出了令人满意的答案。然而,陶哲轩也指出,尽管新模型比之前的版本有所改进,但仍会犯一些明显的错误,并没有展现出独立思考的能力。 陶哲轩的实测体验 陶哲轩进行了三轮测试,对比了o1与之前的模型。首先,他用了一个复杂的数学问题来测试o1,发现其表现...

OpenAI o1模型引发轰动:陶哲轩亲测强化学习成果,门萨智商测试得分高达100,实力问鼎榜首

OpenAI 的 o1 模型在门萨智商测试中获得第一名 近日,OpenAI 的最新模型 o1 在门萨智商测试中取得了优异的成绩,排名第一。著名数学家陶哲轩对其进行了实测,发现 o1 能够成功识别克莱姆定理。此外,OpenAI 的研究副总裁 Mark Chen 表示,大型神经网络可能已经具备足够的算力,在测试中表现出一定的意识。 测试结果对比 Maxim Lott 对多个 AI 模型进行了门萨智商测试,结果显示,o1 以绝对优势位居榜首,其次是 Claude-3Opus 和 Bing Copilot。这套测试题并未出现在任何 AI 训练数据中,因此测试结果具有很高的参考价值...

OpenAI震撼发布:10款全新模型Demo展示人工智能技术巅峰,网友热议代码生成与常识推理能力

OpenAI 发布 o1 大模型:革新推理能力 9月13日凌晨,OpenAI 发布了全新的 o1 系列模型,这一模型在社交媒体上引起了广泛的关注。o1 模型无需专门训练,即可在复杂的数学竞赛和博士级别的科学问答中表现出色。然而,这种强大的推理能力是以牺牲响应速度为代价的。o1 在回答问题前会经历一个较长的内部思维链,这使得其推理任务的表现更为出色。 o1 模型的应用实例 为了展示 o1 的强大功能,OpenAI 公布了十个演示视频: 1. 编写“找松鼠”游戏代码 OpenAI 研究员 Jason Wei 让 o1 编写了一个名为“找松鼠”的视频游戏代码...

16年老程序员当场“退休”,OpenAI o1这么强吗?

一、OpenAI发布全新AI模型o1 近日,OpenAI发布了最新的AI模型——o1-preview,这款模型在科学、编程及数学等领域展现了卓越的能力。此外,他们还推出了一款更加轻量级的版本——o1-mini,不仅效率更高,而且成本更低。 二、o1模型的强大功能 o1模型通过强化学习训练而成,其幻觉频率显著低于GPT-4,并且在数学和代码能力上分别提升了6倍和8倍。在一系列高难度基准测试中,o1的表现超越了人类博士水平,特别是在物理和生物领域的问答环节中。 三、用户反响与体验 OpenAI CEO Sam Altman宣布,o1-preview现已对ChatGPT Plus...

OpenAI 再次给大模型 “泡沫” 续命

引言 近期,OpenAI 发布了备受瞩目的 o1 模型,这一新产品引起了广泛关注。与此同时,作为人工智能领域的领头羊,英伟达的股价在短短两天内上涨了 10%。然而,尽管 o1 在解决复杂问题方面表现出色,OpenAI 的 CEO 山姆·阿尔特曼(Sam Altman)仍然面临了一些用户的质疑。 用户反馈与期待 在阿尔特曼宣布 o1 上线的推文下,一条评论迅速引起了他的注意:“什么时候能用上新的语音功能?”阿尔特曼回应道:“能否先花些时间感谢这项神奇的技术,再期待新功能?”实际上,用户们一直在期待 OpenAI 于今年 5 月承诺的 GPT-4o 端...

OpenAI震撼发布全新O1模型:深度融合强化学习与思维链技术,引领人工智能领域迈向新高度

一、OpenAI发布o1模型 北京时间今日凌晨,OpenAI正式推出了名为OpenAI o1的新模型,该模型之前被称为“Strawberry”,最初的代号为“Q*”。OpenAI CEO萨姆·奥尔特曼(Sam Altman)称之为“新范式的开始”。根据官方信息,o1模型具有更大的规模、更强的推理能力,但同时也更慢、更昂贵。 经过强化学习(Reinforcement Learning)的训练,o1模型在推理能力方面取得了显著进展。研发团队发现,随着训练时间和测试时间的增加,模型的表现逐步提升。这种方法与传统的大规模语言模型(LLM)预训练方式有所不同。o1模型在处理复杂推理问...

【OpenAI推出全新O1模型:推理能力飞跃提升,STEM领域达博士生水平,超越GPT-4,ChatGPT应用更广泛】

近日,OpenAI发布了备受期待的全新AI模型——o1预览版。这款模型在复杂的推理任务中表现出色,能够解决比以往更难的问题,特别是在科学、编程和数学等领域。 一、o1模型的强大推理能力 o1模型展示了卓越的推理能力,能够在回答问题前进行深入思考,并生成一系列内部思维链。在多项基准测试中,o1的表现远超之前的模型。例如,在美国数学奥林匹克预选资格赛中,o1的排名进入前500名;在物理、生物、化学问题的测试中,其准确度甚至超过了人类博士水平。 此外,o1 mini是一款更小巧、更快速的模型,专为数学和编程任务设计,...

「Her」主创 Alexis Conneau 宣布从 OpenAI 离职创业

近期,OpenAI 的一位关键技术人员宣布离职,引起了广泛关注。这位技术人员名叫 Alexis Conneau(亚历克西斯·康诺),他是 OpenAI 版「Her」的技术负责人,同时也是 GPT-4o 实时音频技术的重要贡献者之一。在社交媒体上,他的个人简介显示他还参与了 GPT-5 的研发工作。然而,在 ChatGPT 的「Her」模式正式发布不到两个月的时间内,康诺便选择了离开。 亚历克西斯·康诺是一位法国人,他在 2008 年进入巴黎综合理工学院时,原本是数学专业的学生。直到 2012 年,随着 Hinton 和他的学生 Ilya 带领的 AI 浪潮兴起,康诺开始意...
13456724