标签：思维链

马斯克重磅宣布：Grok 3 AI大模型将于2月18日发布，搭载英伟达H100，思维链技术加持，堪称地球上最聪明的AI，超越所有已发布产品性能。

马斯克宣布Grok 3大模型即将发布，挑战最强AI推理能力 2月16日，据快科技报道，特斯拉CEO埃隆·马斯克宣布，他旗下的人工智能公司xAI将推出号称“地球上最聪明的AI”——Grok 3大模型。该模型将于太平洋时间2月17日晚上8点（北京时间2月18日中午12点）正式发布，并进行现场演示。马斯克表示，Grok 3具备卓越的推理能力，在已有的测试中表现超越了所有已知的同类产品，包括DeepSeek R1和OpenAI o3等知名大模型。这表明Grok 3在处理复杂任务方面具有显著优势。 Grok系列的发展历程与特点 Grok是xAI发布的首个AI大模型产品，首...

来源：

快科技【阅读原文】
Tags：AI大模型 Grok 3 思维链英伟达H100 马斯克

1个月前

深入解析大型语言模型扩展范式：思维链作者Jason Wei详述下一词预测与强化学习在LLM中的应用

一、Jason Wei 的背景与贡献关注 AI 领域的人对 Jason Wei 这个名字一定不陌生。他是 OpenAI 的一位资深研究科学家，经常在 OpenAI 的发布活动中露面。作为思维链概念开山之作《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》的第一作者，他的工作使这一技术广为人知。Jason Wei 在谷歌期间推广了思维链提示概念，并共同领导了指令微调的早期工作。2023 年初，他加入了 OpenAI，参与了 ChatGPT 和其他重大项目。二、演讲概要去年 11 月 20 日，Jason Wei 在宾夕法尼亚大学计算机与信息科学...

来源：

机器之心【阅读原文】
Tags：- 下一词预测 - 扩展范式大型语言模型强化学习思维链

3个月前

Kimi最新推出的k1视觉思考模型

近日，一款新的AI技术引起了人们的关注。只需提供一张图片，这款AI就能推测出一个人的性格特征。不仅如此，通过分析用户的音乐播放列表，AI还能大致推测出用户近期的心理状态。这一切都得益于Kimi最新推出的k1视觉思考模型。距离Kimi推出上一款数学模型k0-math并成功挑战o1仅过去了一个月，k1便迅速问世。与之前的k0-math相比，k1不仅具备更强的推理能力，还增加了视觉分析功能。这意味着用户可以通过拍照上传题目，让k1直接进行解答，其在数理化领域的表现甚至宣称能够匹敌或超越Open AI的o1。此前，我们在测试k0-math...

来源：

快科技【阅读原文】
Tags：k1 强化学习思维链视觉思考模型逻辑推理

3个月前

OpenAI 再次给大模型 “泡沫” 续命

引言近期，OpenAI 发布了备受瞩目的 o1 模型，这一新产品引起了广泛关注。与此同时，作为人工智能领域的领头羊，英伟达的股价在短短两天内上涨了 10%。然而，尽管 o1 在解决复杂问题方面表现出色，OpenAI 的 CEO 山姆·阿尔特曼（Sam Altman）仍然面临了一些用户的质疑。用户反馈与期待在阿尔特曼宣布 o1 上线的推文下，一条评论迅速引起了他的注意：“什么时候能用上新的语音功能？”阿尔特曼回应道：“能否先花些时间感谢这项神奇的技术，再期待新功能？”实际上，用户们一直在期待 OpenAI 于今年 5 月承诺的 GPT-4o 端...

来源：

iFeng科技【阅读原文】
Tags：o1 模型 OpenAI 强化学习思维链算力需求

7个月前

OpenAI震撼发布全新O1模型：深度融合强化学习与思维链技术，引领人工智能领域迈向新高度

一、OpenAI发布o1模型北京时间今日凌晨，OpenAI正式推出了名为OpenAI o1的新模型，该模型之前被称为“Strawberry”，最初的代号为“Q*”。OpenAI CEO萨姆·奥尔特曼（Sam Altman）称之为“新范式的开始”。根据官方信息，o1模型具有更大的规模、更强的推理能力，但同时也更慢、更昂贵。经过强化学习（Reinforcement Learning）的训练，o1模型在推理能力方面取得了显著进展。研发团队发现，随着训练时间和测试时间的增加，模型的表现逐步提升。这种方法与传统的大规模语言模型（LLM）预训练方式有所不同。o1模型在处理复杂推理问...

来源：

iFeng科技【阅读原文】
Tags：o1模型 OpenAI 人工智能强化学习思维链

7个月前

AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

纽约大学的研究揭示了一种AI的新能力，即AI能够在不依赖人类步骤的情况下，通过隐藏的“心算”过程解决复杂任务。研究团队发现，即使将AI的推理步骤替换为无意义的“……”符号，AI在某些任务中的表现仍然能够显著提高。这一发现挑战了以往认为AI需要模仿人类分解任务的观念，并引发了关于AI推理机制的讨论。研究人员通过设计3SUM和2SUM-Transform两个任务来测试这一理论，发现填充“……”的AI模型在长序列任务中保持高准确率，即使没有看到人类的解题步骤。此外，实验还显示，填充token的隐藏层表示包含与下游任务相关的隐性计算，...

来源：

量子位【阅读原文】
Tags：AI 可解释性填充token 思维链推理能力

11个月前