标签：开源

借助免费开源库，任何人都能在火山引擎上轻松开发DeepSeek AI模型应用

科技圈的开源热潮：从模型到应用的新时代过去一周，科技圈可以用三个字概括：“开源周”。曾经各自为战的企业，在 DeepSeek 的推动下纷纷投身于开源浪潮。AI 领域的六小龙企业相继宣布加大模型开源力度，就连百度也加入了这一行列，承诺新一代模型将全面开源。最引人注目的是，远在大洋彼岸的 OpenAI 也不得不承认，自己可能站在了历史错误的一边。火山引擎的独特入场方式面对这股开源热潮，一向低调的火山引擎也坐不住了。与其他企业直接发布模型不同，火山引擎选择了一条不同的路径——推出“大模型应用实验室”。这个平台...

来源：

iFeng科技【阅读原文】
Tags：- 应用开发 AI 模型 DeepSeek 开源火山引擎

3周前

阿里云发布QwQ-32B推理模型，性能媲美DeepSeek-R1

阿里云在3月6日凌晨发布了最新的推理模型QwQ-32B。这款模型的参数量为320亿，虽然远低于DeepSeek-R1的6710亿参数，但在消费级显卡上也能实现本地部署，表现令人惊艳。特别是在数学推理和编程能力方面，QwQ-32B与DeepSeek-R1相当，甚至在通用能力测评中超越了后者。苹果机器学习科学家Awni Hannun（吴恩达的学生）展示了QwQ-32B在配备MLX框架的M4 Max芯片电脑上的运行速度，证实其“非常快”。该模型在Hugging Face和ModelScope上以Apache 2.0许可证开源，可用于商业和研究用途，为企业提供了强大的工具来增强产品和应用程序...

来源：

智东西【阅读原文】
Tags：QwQ-32B 开源推理模型阿里云

4周前

在DeepSeek的冲击之下，大模型六小强如何借助AI技术在开源与商用场景中作出有力「回应」？

DeepSeek冲击之下，大模型六小强如何「回应」？自DeepSeek发布以来，全球大模型市场掀起了一阵波澜。中外各大厂和初创公司纷纷被问及对DeepSeek的看法和应对策略。本文将重点探讨国内六家独角兽大模型创业公司——零一万物、百川智能、阶跃星辰、智谱华章、月之暗面、MiniMax——在DeepSeek冲击下的具体行动与回应。零一万物：聚焦产业应用零一万物的创始人李开复博士早在DeepSeek-R1问世前就表示，公司将不再追求训练超级大模型，而是专注于轻量化模型的研发。这类模型参数适中、性能优异且推理成本更低，更适合商用场景...

来源：

量子位【阅读原文】
Tags：AI DeepSeek 商用场景大模型开源

1个月前

中外大模型加速开源，AI模型成本下降与多模态能力提升！文心一言和GPT-5在算力优化上紧追不舍，免费资源助力创新

国内外大模型厂商掀起开源和免费浪潮，AI技术平民化加速近期，国内外主流大模型厂商如百度、DeepSeek、OpenAI、谷歌等纷纷宣布旗下高端AI模型将转向开源，并计划免费向用户开放。这一趋势不仅标志着大模型竞赛进入白热化阶段，也预示着AI技术正在逐步走进普通百姓的生活。百度与OpenAI的激烈竞争百度和OpenAI作为两大巨头，在短时间内相继发布了多项重要更新。百度宣布将在未来几个月内推出文心大模型4.5系列，并计划于6月30日开始开源。此外，百度还表示今年下半年将发布文心大模型5.0系列。与此同时，OpenAI CEO奥...

来源：

智东西【阅读原文】
Tags：AI模型多模态能力开源成本下降算力优化

1个月前

刚刚！百度正式宣布文心大模型开源，推动AI平权与多模态能力发展

百度宣布开源文心大模型4.5系列，推动AI平权智东西10月22日报道，百度正式宣布将开源其文心大模型4.5系列，并将于6月30日起正式开放源代码。这一举措标志着百度在AI领域的重要战略调整，顺应了全球开源趋势。自DeepSeek开源之风席卷全球以来，开源与闭源的选择一直是AI领域的热门话题。连此前坚持闭源的百度也加入了开源阵营，进一步巩固了开源的优势地位。百度近期连续发布多项重大消息，上周宣布成功点亮昆仑芯三代万卡集群，即将推出3万卡集群；昨日宣布文心一言将于4月1日全面免费，今日又公布了重要的开源计划。 ...

来源：

智东西【阅读原文】
Tags：AI平权多模态能力开源文心大模型百度

2个月前

AI颠覆者：DeepSeek在中美科技竞争中的开源AI模型与技术创新之路

2025年AI行业迎来重大变革：DeepSeek震撼全球 2025年初，国内AI公司DeepSeek以颠覆性的姿态迅速崛起，登顶全球应用下载榜榜首，日活跃用户突破1500万。中美科技界对DeepSeek展开了激烈的讨论，观点交锋不断，有人高度认可，有人冷嘲热讽，甚至有人陷入恐慌。Anthropic CEO达里奥·阿莫迪发表长文呼吁加强对华芯片封锁；OpenAI CEO山姆·奥特曼罕见认错，承认OpenAI的领先性被削弱。美国总统特朗普也指出DeepSeek给美国敲响了警钟。 DeepSeek的成功秘诀 DeepSeek的成功基于三个关键因素： 1. 模型能力追平行业领先水平： ...

来源：

窄播公众号【阅读原文】
Tags：AI模型 DeepSeek 中美科技竞争开源技术创新

2个月前

首个OpenAI免费推理模型o3-mini震撼发布！DeepSeek引领AI模型开源新潮流，奥特曼也来反思：不开源我们错了

OpenAI发布首个免费推理模型o3-mini，DeepSeek引发行业反思近日，OpenAI深夜紧急发布了最新的推理模型系列——o3-mini，其中包括low、medium和high三个版本。这一举措不仅标志着OpenAI首次向用户免费推出推理模型，也引发了业内对开源AI模型的广泛讨论。一、o3-mini系列的亮点 o3-mini系列旨在推动低成本推理的边界，特别针对STEM（科学、技术、工程、数学）领域进行了优化。从正式版发布来看，它在多个方面表现出色： - 性能提升：相比前一代o1-mini，o3-mini在数学编码上的表现更为出色，响应速度更快，平均响应时间缩...

来源：

量子位【阅读原文】
Tags：AI模型 DeepSeek o3-mini OpenAI 开源

2个月前

DeepSeek-R1：中国AI大模型低成本高效训练，开源技术创新引领未来

来自中国的AI大模型DeepSeek-R1震撼全球，成本仅为国外竞品的三十分之一近日，中国的一家AI创业公司DeepSeek（深度求索）正式发布了其最新的大模型DeepSeek-R1。这款模型在数学、代码和自然语言推理等任务上的表现与OpenAI的o1版本相当，甚至在某些基准测试中略胜一筹。DeepSeek-R1的发布在全球AI圈引起了巨大反响。在AIME 2024数学基准测试中，DeepSeek-R1取得了79.8%的得分率，而OpenAI-o1为79.2%。在MATH-500基准测试中，DeepSeek-R1的得分率为97.3%，OpenAI-o1为96.4%。在编码任务中，DeepSeek-R1超越了96.3%的人类...

来源：

iFeng科技【阅读原文】
Tags：AI大模型 DeepSeek 开源强化学习

2个月前

【MiniMax 01首次开源：线性注意力机制助力大模型突破Transformer架构，中国AI Agent震惊海外开发者】

2025年MiniMax再推两大模型，性能与开源引关注 2025年初，中国AI公司MiniMax再次引发行业热议。继2024年公布全模态模型家族后，时隔五个月，MiniMax推出了两款全新的大模型，并且完全开源了模型权重。这两款新模型在性能上与GPT-4o和Claude-3.5-Sonnet相当，尤其在上下文窗口处理能力方面表现出色，处理速度是其他顶尖模型的20至32倍。更重要的是，MiniMax首次大规模实现了线性注意力机制（Linear Attention），这一机制将传统注意力机制的二次计算复杂度转变为线性复杂度，显著降低了计算复杂度并提升了训练速度。早在20...

来源：

iFeng科技【阅读原文】
Tags：AI Agent MiniMax 大模型开源线性注意力机制

2个月前

AMD发布AMD-135M：开源小型语言模型通过推测解码实现性能提升3.88倍

AMD发布首款小型语言模型AMD-135M 10月1日，快科技报道，AMD正式发布了其首款小型语言模型（SLM），命名为“AMD-135M”。相较于当前日益庞大的大型语言模型（LLM），这款小型语言模型体积更小、灵活性更高，并且具有更强的专业性和隐私保护能力，非常适合企业内部部署。 AMD-135M的两个版本 AMD-135M属于Llama系列模型，共有两个版本：基础型“AMD-Llama-135M”和扩展型“AMD-Llama-135M-code”。基础型“AMD-Llama-135M”拥有6700亿个token，在八块Instinct MIM250 64GB加速器上进行了为期六天的训练。而扩展型“AMD-Llama-135M-c...

来源：

iFeng科技【阅读原文】
Tags：AMD-135M 小型语言模型开源性能提升推测解码

6个月前

12 3 4