标签：开源大模型

DeepSeek超越150万模型：全球最受欢迎的开源大模型，引领AI算力新潮流，与Hugging Face和英伟达共同推动技术革新

中国开源大模型DeepSeek-R1在Hugging Face平台大放异彩 2月24日，据快科技报道，全球知名开源平台Hugging Face的联合创始人兼首席执行官Clement Delangue宣布了一项令人瞩目的数据：中国开源大模型DeepSeek-R1在该平台上脱颖而出，成为最受欢迎的开源大模型之一。据统计，DeepSeek-R1在超过150万个模型中获得了超过1万次点赞，并且下载量突破了1000万次，刷新了Hugging Face平台的历史记录。 DeepSeek在全球范围内的影响力 DeepSeek不仅在国内广受欢迎，在国际上也引起了巨大反响。特别是在春节期间，DeepSeek迅速走红，...

来源：

iFeng科技【阅读原文】
Tags：AI算力 DeepSeek Hugging Face 开源大模型英伟达

1个月前

Meta紧急应对开源大模型DeepSeek，高预算投入AI创新引发内部恐慌，英伟达技术助力深度分析

深入解析 DeepSeek 对美国 AI 公司的冲击最近，国内 AI 创业公司 DeepSeek 的一系列动作引起了广泛关注，尤其是开源大模型的发布，让许多美国科技巨头感到震惊。其中，Meta 的生成式 AI 团队似乎是最先陷入恐慌的公司之一。根据匿名职场社区 TeamBlind 上的一篇帖子，DeepSeek 的低成本高效率让 Meta 无法解释其高昂预算的合理性。 DeepSeek-V3 和 DeepSeek-R1 引发的连锁反应这一切始于 DeepSeek-V3 的发布，该模型在基准测试中超越了 Llama 4 等其他知名模型。更令人瞩目的是，DeepSeek 只用了 558 万美元的训练成本...

来源：

机器之心【阅读原文】
Tags：AI 创新 DeepSeek Meta 开源大模型英伟达

2个月前

大模型行业探析：真正的‘开源大模型’是否存在？对比审视开源大模型与闭源模型，如Llama 3.1与Mistral Large2的发展趋势

近期，开源大模型市场异常活跃，苹果推出了70亿参数的小模型DCLM，紧接着Meta发布了Llama 3.1和Mistral Large2，后者在多项基准测试中的表现甚至超越了某些闭源的顶尖模型（SOTA）。尽管开源派取得了显著成果，但与闭源派之间的争论仍未停息。一方面，Meta在发布Llama 3.1之后宣称：“我们正步入一个由开源引领的新纪元。”另一方面，《华盛顿邮报》上Sam Altman的文章将开源与闭源之争上升到了国家和意识形态的高度。在中国的世界人工智能大会上，百度CEO李彦宏直言：“开源实际上是智商税”，因为闭源模型在性能上更强且推理...

来源：

硅星人Pro公众号【阅读原文】
Tags：Llama 3.1 Mistral Large2 大模型开源开源大模型闭源模型

8个月前

英伟达与Meta在SIGGRAPH图形大会上支持人工智能大模型开源，黄仁勋扎克伯格展示友好交流

在最近举办的第51届SIGGRAPH图形大会上，两位科技巨头的创始人——英伟达的黄仁勋和Meta的马克·扎克伯格进行了一场引人入胜的对话，共同探讨了人工智能（AI）以及仿真技术的未来发展。这次盛会于7月29日在美丽的美国城市丹佛拉开帷幕。对话中，黄仁勋高度赞扬了Meta在开源大型模型领域的贡献，并表达了双方对于继续支持开源路线的一致看法。这种合作的态度不仅展现了两家公司在推动技术创新方面的共同愿景，也预示着未来可能的合作机会。值得注意的是，在这次会谈即将结束之际，现场大屏幕展示了一张非常特别的照片：黄仁...

来源：

界面新闻【阅读原文】
Tags：Meta SIGGRAPH图形大会人工智能开源大模型英伟达

8个月前

吴恩达反对SB-1047法案：开源大模型与AI创新的潜在危机，生成式AI何去何从?

在7月12日的黎明时刻，国际知名AI专家吴恩达公开反对美国加州即将出台的SB-1047法案，指出其对开源人工智能模型的苛刻规定。他认为，该法案的根本错误在于试图监管开源大模型，而非基于这些模型的生成式AI产品。根据SB-1047，价值上亿美元的开源模型需提交年度安全报告，并对通过模型进行违法活动的开发者追究法律责任，这种类比于菜刀制造商因消费者犯罪而担责的法规被批评为荒谬。有趣的是，该法案意图限制中国使用Meta、谷歌等公司的开源模型参与生成式AI竞赛，但中国已有如阿里Qwen系列和零一万物Yi系列等受欢迎的开源大...

来源：

AIGC开放社区公众号【阅读原文】
Tags：AI创新 SB-1047法案吴恩达开源大模型生成式AI

9个月前

阿里通义Qwen2拿下美国最新测评榜单开源大模型全球第一

在人工智能领域，一项新的评测基准——LiveBench AI近日由图灵奖得主杨立昆及其合作机构推出，该基准对全球顶尖的开闭源大模型进行了评估。在首次发布的测评榜单上，阿里云通义千问的开源大模型Qwen2-72B脱颖而出，成为全球第一的开源大模型，且是中国唯一进入前十的模型，超越了Meta的Llama3-70B。GPT-4o虽然位居榜首，但Qwen2-72B作为开源模型的优异表现备受瞩目。 LiveBench AI的测评覆盖了34个领先模型，Qwen系列共有7款模型上榜，显示出强大的整体实力。除了Qwen2-72B外，还包括Qwen1.5的多个版本，它们是除GPT系列之外...

来源：

量子位【阅读原文】
Tags：LiveBench AI Qwen2-72B 开源大模型杨立昆阿里云通义

10个月前

性能对标Llama 3，算力消耗仅1/19！源2.0-M32大幅提升模算效率

浪潮信息发布了开源大模型源2.0-M32，该模型基于MoE技术，拥有32个专家模块和400亿参数，但在运行时仅需37亿激活参数，大大降低了算力需求。相比700亿参数的Llama 3，源2.0-M32在训练、微调和推理过程中的算力消耗显著减少，实现了性能与效率的双重提升。在模型推理阶段，源2.0-M32的算力需求仅为Llama 3的1/19。此外，源2.0-M32在微调训练阶段的算力消耗也远低于Llama 3。通过算法结构创新，如门控网络技术和局部注意力过滤增强机制，源2.0-M32提升了模型精度，同时降低了算力消耗。浪潮信息致力于为企业提供更经济、高效的...

来源：

智东西【阅读原文】
Tags：MoE模型开源大模型浪潮信息源2.0-M32 算力效率

10个月前

重建Meta帝国：用AI“回敬”TikTok

在2023年5月的美国白宫AI闭门会议上，Meta缺席引发了业界讨论。尽管如此，Meta通过开源大模型在AI领域取得突破，打破了OpenAI和谷歌的垄断，实现了AI界的“安卓时刻”。Meta的业绩增长得益于AI技术的运用，特别是在内容推荐和广告业务上的创新。例如，Meta利用AI创建了一个发现引擎，提高了内容理解与用户行为分析的精确度，增强了用户体验，从而增加了用户在Facebook和Instagram上的停留时间。此外，Meta的Reels功能对TikTok构成了竞争，用户增长逐渐恢复。在广告业务方面，Meta面临苹果的隐私新规挑战，但随着中国电商如Te...

来源：

表外表里公众号【阅读原文】
Tags：AI Meta Reels 广告业务开源大模型

10个月前

LobeChat支持通过网页版直接调用Ollama 本地模型体验媲美ChatGPT

LobeChat，一款创新的网页平台，最近引起了关注。这个平台特别之处在于它允许用户直接在网页上利用Ollama本地模型进行互动，无需复杂的设置或第三方API。用户在安装了Ollama之后，便能与开源大模型如llama3、wizardLM、Gemma等进行无缝对话。LobeChat确保了高速的对话体验，只要用户的设备性能足够强大，其速度可比肩商业API。在用户界面方面，LobeChat的设计简洁明了，提供与ChatGPT类似的优质体验。对于新用户，平台提供详尽的引导，帮助他们轻松上手。如果需要下载模型，LobeChat也提供了内置功能，使得整个过程更为便...

来源：

站长之家【阅读原文】
Tags：LobeChat Ollama 开源大模型本地模型交互网页应用

11个月前

周鸿祎谈对“2024年AI产业发展的十六个趋势”预测

周鸿祎揭示2024年AI发展趋势：从开源大模型到人形机器人在近日的一加ACE 3V手机发布会上，网络安全专家周鸿祎分享了他对2024年人工智能产业的展望。他预测，AI领域将迎来一系列重大变革，包括： 1. 开源大模型的繁荣，预示着大模型将在各个领域普及。 2. 云端超级大模型将成为大国间AGI竞赛的核心，模型规模将持续扩大。 3. 同时，小型化大模型将嵌入智能设备，赋予终端更多智能。 4. 企业级市场将见证垂直大模型的广泛应用，企业将拥有多个定制模型。 5. 多模态能力将成为大模型的关键，推动AIGC功能如文生图和视频的创...

来源：

iFeng科技【阅读原文】
Tags：AGI AI 人形机器人多模态开源大模型

1年前 (2024)