自DeepSeek发布以来,全球大模型市场掀起了一阵波澜。中外各大厂和初创公司纷纷被问及对DeepSeek的看法和应对策略。本文将重点探讨国内六家独角兽大模型创业公司——零一万物、百川智能、阶跃星辰、智谱华章、月之暗面、MiniMax——在DeepSeek冲击下的具体行动与回应。
零一万物:聚焦产业应用
零一万物的创始人李开复博士早在DeepSeek-R1问世前就表示,公司将不再追求训练超级大模型,而是专注于轻量化模型的研发。这类模型参数适中、性能优异且推理成本更低,更适合商用场景。近期,零一万物与苏州高新区联合成立了产业大模型基地,旨在推动大模型技术从实验室走向生产线。此外,该公司还与阿里云合作建立了“产业大模型联合实验室”,进一步加速了其模型能力的商业化进程。
百川智能:全场景推理与医疗应用
百川智能在DeepSeek-R1发布后不久推出了新模型Baichuan-M1-preview,该模型具备语言、视觉和搜索三大领域的推理能力。特别值得一提的是,Baichuan-M1-preview解锁了医疗循证模式,实现了从医疗证据检索到深度推理的完整端到端服务。2月13日,基于此模型打造的“AI儿科医生”在北京儿童医院进行了首次多学科会诊,展现了其在临床推理方面的强大能力。
阶跃星辰:多模态创新与产品迭代
阶跃星辰在DeepSeek-R1发布当天发布了两款语言模型——Step-2-mini和Step-2 文学大师版。前者以较小的参数量保有较高的性能,后者则专为文学创作设计。随后,公司继续推出升级语音模型Step-1o Audio和多模态理解大模型Step-1o Vision,并发布了视频生成模型Step-Video V2版本。此外,旗下应用“跃问”也推出了全新功能AI创意板,用户无需代码即可实现创意开发并全平台分享成果。
智谱华章:国际合作与自主系统
清华大学计算机系教授唐杰在巴黎举行的第三届人工智能行动峰会上发言,阐述了对AGI发展的看法。智谱华章在2025年的关键词包括自主的大型语言模型(Agentic LLMs)和协同工作的自主系统。面对DeepSeek的冲击,智谱华章不仅继续与三星合作,让Agentic GLM登陆Galaxy S25系列手机,还悄然与热门AI画图应用“捏ta”展开合作,推出了联名活动。
月之暗面:强化多模态能力
月之暗面在DeepSeek-R1发布一个半小时后宣布了旗下Kimi k1.5多模态思考模型。该模型通过长上下文展开和策略优化改进,实现了更强的性能,并具备联合推理文本和视觉两种模态的能力。相关论文《Kimi k1.5:Scaling Reinforcement Learning With LLMs》详细介绍了模型的设计和训练方法,展示了其在数学和编程上的出色表现。
MiniMax:开源与语音模型升级
MiniMax在1月20日升级发布了T2A-01系列语音模型,并上线了海螺语音产品。该系列模型支持17种语言及上百种预置音色,用户可自由配置输出语音的情绪、语速、音高等参数。值得注意的是,MiniMax在当日宣布了MiniMax-01系列模型的开源,采用了新型Lightning Attention架构,使模型能够高效处理4M token上下文,显著提升了处理能力。
冲击之下,行业整体变化
DeepSeek的发布不仅影响了国内六家大模型独角兽公司,还引发了整个科技行业的变革。许多云计算厂商和AI Infra平台迅速上线DeepSeek API,优化截断率、回复速度和准确率,降低了大模型推理门槛。百度、腾讯、华为、阿里等大厂也纷纷接入R1模型,开放兼容用户体验最佳的模型。国际上,DeepSeek已成为华尔街分析师会议上的高频话题,众多科技巨头在其财报中提及这一新兴势力。
总之,DeepSeek的冲击带来了新的视角和发展机遇,推动了整个AI行业的进步。正如坊间流传的新梗所言:“一鲸起,万物生”。
本文来源: