标签：推理模型

OpenAI推出史上最昂贵模型o1-pro，单价远超DeepSeek，100万输出token售价600美元，ai模型领域再掀波澜，推理模型成本成为焦点

OpenAI推出了其史上最昂贵的模型，比DeepSeek高出270倍的价格引发了热议！以下是关于这一事件的详细报道和分析。 1. 模型价格惊人近日，OpenAI上线了推理模型o1-pro的API。然而，当用户看到价格时，不禁感叹其高昂的成本。100万输入/输出token的价格分别为150美元和600美元。与DeepSeek相比，其输出价格整整贵了270倍，这使得许多网友纷纷吐槽：“除非它的智能达到了爱因斯坦级别，否则不值得。” 2. 社交媒体上的争议关于o1-pro的价格问题，在Reddit等平台上掀起了热烈讨论。尽管价格高昂，但OpenAI坚称o1-pro物有所值...

来源：

量子位【阅读原文】
Tags：AI模型 DeepSeek o1-pro OpenAI 推理模型

2周前

阿里云发布QwQ-32B推理模型，性能媲美DeepSeek-R1

阿里云在3月6日凌晨发布了最新的推理模型QwQ-32B。这款模型的参数量为320亿，虽然远低于DeepSeek-R1的6710亿参数，但在消费级显卡上也能实现本地部署，表现令人惊艳。特别是在数学推理和编程能力方面，QwQ-32B与DeepSeek-R1相当，甚至在通用能力测评中超越了后者。苹果机器学习科学家Awni Hannun（吴恩达的学生）展示了QwQ-32B在配备MLX框架的M4 Max芯片电脑上的运行速度，证实其“非常快”。该模型在Hugging Face和ModelScope上以Apache 2.0许可证开源，可用于商业和研究用途，为企业提供了强大的工具来增强产品和应用程序...

来源：

智东西【阅读原文】
Tags：QwQ-32B 开源推理模型阿里云

4周前

多位数乘法,大模型数学能力的现状与挑战

传统的大规模语言模型（LLM）在数学计算方面表现不佳，尤其是面对简单的多位数乘法时，常常出现错误。然而，随着推理模型如o1、o3和DeepSeek-R1的推出，情况正在逐渐改善。例如，DeepSeek-R1在AIME 2024竞赛中取得了79.8%的准确率，而OpenAI发布的o3-mini (high)更是达到了87.3%的准确度。尽管如此，这些模型在处理多位数乘法时仍然存在显著的局限性。实验结果：多位数乘法的挑战滑铁卢大学助理教授邓云天通过实验发现，即使是较为先进的模型如o1，在处理超过9x9的乘法时，准确度明显下降。GPT-4o则在4x4乘法时就遇到了困...

来源：

机器之心【阅读原文】
Tags：Transformer 多位数乘法推理模型自我提升长度泛化

2个月前

OpenAI GPT系列迎来重大突破：多模态整合与推理模型助力GPT-5.5加速到来，奥特曼确认GPT-4.5已就绪，年底发布全自主智能体

OpenAI CEO Sam Altman 东京之行透露未来 AI 发展方向近日，OpenAI 的 CEO Sam Altman 和 CPO Kevin Weil 在东京大学与师生进行了深入交流。此次访问正值软银创始人孙正义与 OpenAI 商讨高达 5000 亿美元的投资之际，Sam Altman 在问答环节中透露了许多关于 OpenAI 未来发展的关键信息。 1. GPT 系列的迭代与发展目前，OpenAI 已经达到了 GPT-4.5，并预计在不久的将来推出 GPT-5.5。值得注意的是，这一进展并不需要 100 倍以上的计算能力。推理模型和强化学习技术的进步显著提高了计算效率，使得较小的模型也能实现 GPT...

来源：

机器之心【阅读原文】
Tags：GPT系列 OpenAI 多模态整合推理模型智能体

2个月前

清华人大出品的Search-o1推理模型：自主检索提升复杂推理任务与多跳QA性能，超越人类专家水平

新框架Search-o1：大幅提升推理模型性能，清华人大联合出品衡宇白小交发自凹非寺量子位 | 公众号 QbitAI 近日，清华大学和中国人民大学联手推出了一款名为「Search-o1」的新型推理模型框架。该框架在博士级别的科学问答、数学、代码能力等11项评测中表现出色，拿下了10个第一，显著提升了Qwen版o1的成绩。 # 解决推理过程中的“知识不足”问题传统的推理模型在遇到复杂问题时，常常因为知识不足而卡壳，导致推理链中的错误传递。Search-o1通过引入自主搜索机制，有效解决了这一问题。当模型在推理过程中遇到不确定的...

来源：

量子位【阅读原文】
Tags：Search-o1 复杂推理任务多跳QA 推理模型自主检索

2个月前

低成本推理模型的突破：Sky-T1-32B-Preview

450 美元的价格乍一听不算便宜，但如果这是训练一个拥有 32B 参数的推理模型的成本呢？加州大学伯克利分校的天空计算实验室（NovaSky）最近发布了 Sky-T1-32B-Preview 模型，其训练成本仅为 450 美元。这一成果表明，高级推理能力的开发正变得越来越经济和高效。开源贡献与技术细节 Sky-T1-32B-Preview 不仅在多个关键基准测试中表现出色，还成为第一个真正开源的推理模型。团队发布了训练数据集、代码和模型权重，任何人都可以轻松复制并改进该模型。这为学术界和开源社区提供了宝贵资源。成本降低的背后不久前，训...

来源：

机器之心【阅读原文】
Tags：合成数据大模型技术开源模型推理模型推理能力

3个月前

刚刚，OpenAI推出最新o3模型惊喜，高性能推理模型每任务耗费数千美元，注重安全测试与自然语言处理突破

OpenAI 发布新推理模型 o3 和 o3-mini，安全测试先行近日，OpenAI 经历了为期12天的发布周期，终于迎来了尾声。正如外界所预期的那样，新的推理系列模型——o3 和 o3-mini 成为了这次发布的收官之作。o3 系列模型是继 o1 之后的新一代产品，其显著特点是在回答问题之前进行更深入的思考（推理），从而提高回答的准确性和质量。值得注意的是，OpenAI 在命名上跳过了 o2。据 The Information 报道，这一决定是为了避免与英国电信公司 O2 的名称混淆，进而引发版权问题。OpenAI 的 CEO Sam Altman 在今天的直播中也确认了这一...

来源：

机器之心【阅读原文】
Tags：o3模型 OpenAI 安全测试推理模型自然语言处理

3个月前