DeepSeek引发科技股震荡,砍掉英伟达台积电5万亿市值!Janus-Pro与AI模型助力多模态理解,登五大外媒头版,OpenAI紧急发布预告

智东西报道:国产AI新星DeepSeek掀起全球科技股震荡

近日,一家来自中国的AI公司——DeepSeek,在硅谷和华尔街掀起了巨大波澜。1月28日,这家公司发布了全新的开源多模态AI模型Janus-Pro,进一步巩固了其在全球AI领域的地位。

DeepSeek的崛起引发美股科技股震荡

自DeepSeek发布高性能、低成本的新模型R1以来,这家中国AI公司迅速成为全球关注的焦点。新模型不仅在性能上超越了OpenAI的DALL-E 3和Stable Diffusion,还在成本效益方面表现出色,被誉为“国产AI价格屠夫”。这一事件导致美股科技股大幅下跌,特别是英伟达、台积电等芯片巨头市值蒸发数千亿美元,令整个硅谷陷入恐慌。

英伟达和台积电市值重挫

受DeepSeek冲击,英伟达股价暴跌17%,市值蒸发近6000亿美元(约合人民币4.35万亿元),创始人黄仁勋的财富缩水201亿美元(约合人民币1458亿元)。与此同时,台积电市值也蒸发了1508亿美元(约合人民币1.09万亿元)。其他科技股如微软、谷歌母公司Alphabet、博通、ASML等也受到不同程度的影响。

苹果逆势上涨

值得注意的是,苹果在这场股市风暴中表现稳健,逆势上涨3.2%,重返全球市值第一的位置。这表明市场对苹果在AI竞赛中的态度相对保守。

Janus-Pro技术解析

DeepSeek发布的Janus-Pro包括1B和7B两款尺寸,具备生成高质量AI图像的能力,并且一如既往地保持开源、免费、可商用的特点。根据技术报告,Janus-Pro在多个基准测试中表现出色,特别是在多模态理解和文本到图像的指令遵循能力方面取得了显著进步。

技术改进与优势

Janus-Pro采用了优化的训练策略、扩展的训练数据,并扩展到更大的模型尺寸。通过解耦视觉编码,将视觉理解与图像生成任务分开,确保两个任务不会互相干扰,从而在多模态理解和生成任务中都取得了优异的性能。此外,研究人员还调整了不同数据集的比例,提高了训练效率和整体性能。

未来展望

尽管Janus-Pro在多模态理解和文生图指令遵循能力上取得了显著进展,但仍存在一些局限性,如输入分辨率限制为384 × 384,影响细粒度任务的性能。不过,随着技术的不断进步,这些问题有望在未来得到解决。

本文来源: 智东西【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...