中国市场AI大模型DeepSeek震撼硅谷,苹果App Store下载量激增,对冲基金纷纷关注其背后原因

深度求索(DeepSeek)震撼发布大模型,引发全球关注

近日,中国AI公司深度求索(DeepSeek)发布的大型语言模型DeepSeek-R1在业界引起轰动。这款模型以更低的成本和更小的算力规模实现了与美国顶尖AI模型相媲美的效果。最新数据显示,DeepSeek已登顶中国和美国的苹果App Store应用商店,超越了ChatGPT,引发了西方媒体的关注和赞叹。

高盛报告:中国AI崛起影响美股市场

高盛发布的一份报告显示,随着中国AI大模型DeepSeek的强势崛起,对冲基金开始观望美国本土AI热潮是否能持续。上周,对冲基金已开始撤离科技股,导致美股市场周一遭遇科技股抛售狂潮,纳斯达克指数开盘重挫超过3.5%,芯片股集体走低。英伟达、博通、AMD等公司股价大幅下跌,其中英伟达市值蒸发近5900亿美元。

DeepSeek简介及其发展背景

DeepSeek成立于2023年7月17日,由知名量化资管巨头幻方量化创立,专注于开发先进的大语言模型(LLM)。创始人梁文锋出生于广东湛江,毕业于浙江大学信息与电子工程学系,拥有本科和硕士学位。2008年起带领团队探索全自动量化交易,2015年正式成立幻方量化。2021年,幻方量化的资产管理规模突破千亿大关,跻身国内量化私募领域的“四大天王”。

DeepSeek的技术优势及市场表现

DeepSeek的成功在于其以极小的成本训练出了可以与OpenAI的ChatGPT一较高下的AI大模型。2024年5月,DeepSeek发布了混合专家语言模型DeepSeek-V2,同年12月推出性能优越且性价比高的DeepSeek-V3,被硅谷同行誉为“来自东方的神秘力量”。DeepSeek-R1在数学、代码、自然语言推理等任务上的表现与OpenAI的O1模型正式版不相上下,并采用MIT许可协议,支持免费商用、任意修改和衍生开发。

DeepSeek的成本优势及市场反应

DeepSeek-R1的预训练费用仅为557.6万美元,是OpenAI GPT-4o模型训练成本的不到十分之一。DeepSeek公布的API定价也远低于OpenAI,每百万输入tokens收费1元(缓存命中)/4元(缓存未命中),每百万输出tokens收费16元。这一收费大约是OpenAI o1运行成本的三十分之一。业内认为,DeepSeek正打破算力为王的行业规则,通过软件架构及算法的革新,开辟了一条通往更高性能AI大模型的新思路。

DeepSeek爆火背后的技术和市场挑战

DeepSeek的火爆出圈带来了巨大的用户访问量,导致服务器一度无法满足大量用户的并发需求,甚至出现短时闪崩现象。对此,DeepSeek回应称,问题已在数分钟内得到解决。此外,DeepSeek还面临恶意攻击的问题,公司表示正在积极应对,并感谢用户的理解和支持。

未来展望

梁文锋在接受采访时强调,中国AI不可能永远处在跟随的位置。他认为,中国AI的发展需要建立一个类似西方技术社区和产业的生态,才能真正实现原创性和领先性。

本文来源: TechWeb.com.cn【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...