标签:开源
借助免费开源库,任何人都能在火山引擎上轻松开发DeepSeek AI模型应用
科技圈的开源热潮:从模型到应用的新时代 过去一周,科技圈可以用三个字概括:“开源周”。曾经各自为战的企业,在 DeepSeek 的推动下纷纷投身于开源浪潮。AI 领域的六小龙企业相继宣布加大模型开源力度,就连百度也加入了这一行列,承诺新一代模型将全面开源。最引人注目的是,远在大洋彼岸的 OpenAI 也不得不承认,自己可能站在了历史错误的一边。 火山引擎的独特入场方式 面对这股开源热潮,一向低调的火山引擎也坐不住了。与其他企业直接发布模型不同,火山引擎选择了一条不同的路径——推出“大模型应用实验室”。这个平台...
阿里云发布QwQ-32B推理模型,性能媲美DeepSeek-R1
阿里云在3月6日凌晨发布了最新的推理模型QwQ-32B。这款模型的参数量为320亿,虽然远低于DeepSeek-R1的6710亿参数,但在消费级显卡上也能实现本地部署,表现令人惊艳。特别是在数学推理和编程能力方面,QwQ-32B与DeepSeek-R1相当,甚至在通用能力测评中超越了后者。 苹果机器学习科学家Awni Hannun(吴恩达的学生)展示了QwQ-32B在配备MLX框架的M4 Max芯片电脑上的运行速度,证实其“非常快”。该模型在Hugging Face和ModelScope上以Apache 2.0许可证开源,可用于商业和研究用途,为企业提供了强大的工具来增强产品和应用程序...
在DeepSeek的冲击之下,大模型六小强如何借助AI技术在开源与商用场景中作出有力「回应」?
DeepSeek冲击之下,大模型六小强如何「回应」? 自DeepSeek发布以来,全球大模型市场掀起了一阵波澜。中外各大厂和初创公司纷纷被问及对DeepSeek的看法和应对策略。本文将重点探讨国内六家独角兽大模型创业公司——零一万物、百川智能、阶跃星辰、智谱华章、月之暗面、MiniMax——在DeepSeek冲击下的具体行动与回应。 零一万物:聚焦产业应用 零一万物的创始人李开复博士早在DeepSeek-R1问世前就表示,公司将不再追求训练超级大模型,而是专注于轻量化模型的研发。这类模型参数适中、性能优异且推理成本更低,更适合商用场景...
中外大模型加速开源,AI模型成本下降与多模态能力提升!文心一言和GPT-5在算力优化上紧追不舍,免费资源助力创新
国内外大模型厂商掀起开源和免费浪潮,AI技术平民化加速 近期,国内外主流大模型厂商如百度、DeepSeek、OpenAI、谷歌等纷纷宣布旗下高端AI模型将转向开源,并计划免费向用户开放。这一趋势不仅标志着大模型竞赛进入白热化阶段,也预示着AI技术正在逐步走进普通百姓的生活。 百度与OpenAI的激烈竞争 百度和OpenAI作为两大巨头,在短时间内相继发布了多项重要更新。百度宣布将在未来几个月内推出文心大模型4.5系列,并计划于6月30日开始开源。此外,百度还表示今年下半年将发布文心大模型5.0系列。与此同时,OpenAI CEO奥...
刚刚!百度正式宣布文心大模型开源,推动AI平权与多模态能力发展
百度宣布开源文心大模型4.5系列,推动AI平权 智东西10月22日报道,百度正式宣布将开源其文心大模型4.5系列,并将于6月30日起正式开放源代码。这一举措标志着百度在AI领域的重要战略调整,顺应了全球开源趋势。 自DeepSeek开源之风席卷全球以来,开源与闭源的选择一直是AI领域的热门话题。连此前坚持闭源的百度也加入了开源阵营,进一步巩固了开源的优势地位。百度近期连续发布多项重大消息,上周宣布成功点亮昆仑芯三代万卡集群,即将推出3万卡集群;昨日宣布文心一言将于4月1日全面免费,今日又公布了重要的开源计划。 ...
AI颠覆者:DeepSeek在中美科技竞争中的开源AI模型与技术创新之路
2025年AI行业迎来重大变革:DeepSeek震撼全球 2025年初,国内AI公司DeepSeek以颠覆性的姿态迅速崛起,登顶全球应用下载榜榜首,日活跃用户突破1500万。中美科技界对DeepSeek展开了激烈的讨论,观点交锋不断,有人高度认可,有人冷嘲热讽,甚至有人陷入恐慌。Anthropic CEO达里奥·阿莫迪发表长文呼吁加强对华芯片封锁;OpenAI CEO山姆·奥特曼罕见认错,承认OpenAI的领先性被削弱。美国总统特朗普也指出DeepSeek给美国敲响了警钟。 DeepSeek的成功秘诀 DeepSeek的成功基于三个关键因素: 1. 模型能力追平行业领先水平: ...
首个OpenAI免费推理模型o3-mini震撼发布!DeepSeek引领AI模型开源新潮流,奥特曼也来反思:不开源我们错了
OpenAI发布首个免费推理模型o3-mini,DeepSeek引发行业反思 近日,OpenAI深夜紧急发布了最新的推理模型系列——o3-mini,其中包括low、medium和high三个版本。这一举措不仅标志着OpenAI首次向用户免费推出推理模型,也引发了业内对开源AI模型的广泛讨论。 一、o3-mini系列的亮点 o3-mini系列旨在推动低成本推理的边界,特别针对STEM(科学、技术、工程、数学)领域进行了优化。从正式版发布来看,它在多个方面表现出色: - 性能提升:相比前一代o1-mini,o3-mini在数学编码上的表现更为出色,响应速度更快,平均响应时间缩...
DeepSeek-R1:中国AI大模型低成本高效训练,开源技术创新引领未来
来自中国的AI大模型DeepSeek-R1震撼全球,成本仅为国外竞品的三十分之一 近日,中国的一家AI创业公司DeepSeek(深度求索)正式发布了其最新的大模型DeepSeek-R1。这款模型在数学、代码和自然语言推理等任务上的表现与OpenAI的o1版本相当,甚至在某些基准测试中略胜一筹。DeepSeek-R1的发布在全球AI圈引起了巨大反响。 在AIME 2024数学基准测试中,DeepSeek-R1取得了79.8%的得分率,而OpenAI-o1为79.2%。在MATH-500基准测试中,DeepSeek-R1的得分率为97.3%,OpenAI-o1为96.4%。在编码任务中,DeepSeek-R1超越了96.3%的人类...
【MiniMax 01首次开源:线性注意力机制助力大模型突破Transformer架构,中国AI Agent震惊海外开发者】
2025年MiniMax再推两大模型,性能与开源引关注 2025年初,中国AI公司MiniMax再次引发行业热议。继2024年公布全模态模型家族后,时隔五个月,MiniMax推出了两款全新的大模型,并且完全开源了模型权重。这两款新模型在性能上与GPT-4o和Claude-3.5-Sonnet相当,尤其在上下文窗口处理能力方面表现出色,处理速度是其他顶尖模型的20至32倍。 更重要的是,MiniMax首次大规模实现了线性注意力机制(Linear Attention),这一机制将传统注意力机制的二次计算复杂度转变为线性复杂度,显著降低了计算复杂度并提升了训练速度。早在20...
AMD发布AMD-135M:开源小型语言模型通过推测解码实现性能提升3.88倍
AMD发布首款小型语言模型AMD-135M 10月1日,快科技报道,AMD正式发布了其首款小型语言模型(SLM),命名为“AMD-135M”。相较于当前日益庞大的大型语言模型(LLM),这款小型语言模型体积更小、灵活性更高,并且具有更强的专业性和隐私保护能力,非常适合企业内部部署。 AMD-135M的两个版本 AMD-135M属于Llama系列模型,共有两个版本:基础型“AMD-Llama-135M”和扩展型“AMD-Llama-135M-code”。基础型“AMD-Llama-135M”拥有6700亿个token,在八块Instinct MIM250 64GB加速器上进行了为期六天的训练。而扩展型“AMD-Llama-135M-c...