标签:开源大模型

大模型行业探析:真正的‘开源大模型’是否存在?对比审视开源大模型与闭源模型,如Llama 3.1与Mistral Large2的发展趋势

近期,开源大模型市场异常活跃,苹果推出了70亿参数的小模型DCLM,紧接着Meta发布了Llama 3.1和Mistral Large2,后者在多项基准测试中的表现甚至超越了某些闭源的顶尖模型(SOTA)。尽管开源派取得了显著成果,但与闭源派之间的争论仍未停息。 一方面,Meta在发布Llama 3.1之后宣称:“我们正步入一个由开源引领的新纪元。”另一方面,《华盛顿邮报》上Sam Altman的文章将开源与闭源之争上升到了国家和意识形态的高度。在中国的世界人工智能大会上,百度CEO李彦宏直言:“开源实际上是智商税”,因为闭源模型在性能上更强且推理...

英伟达与Meta在SIGGRAPH图形大会上支持人工智能大模型开源,黄仁勋扎克伯格展示友好交流

在最近举办的第51届SIGGRAPH图形大会上,两位科技巨头的创始人——英伟达的黄仁勋和Meta的马克·扎克伯格进行了一场引人入胜的对话,共同探讨了人工智能(AI)以及仿真技术的未来发展。这次盛会于7月29日在美丽的美国城市丹佛拉开帷幕。 对话中,黄仁勋高度赞扬了Meta在开源大型模型领域的贡献,并表达了双方对于继续支持开源路线的一致看法。这种合作的态度不仅展现了两家公司在推动技术创新方面的共同愿景,也预示着未来可能的合作机会。 值得注意的是,在这次会谈即将结束之际,现场大屏幕展示了一张非常特别的照片:黄仁...

吴恩达反对SB-1047法案:开源大模型与AI创新的潜在危机,生成式AI何去何从?

在7月12日的黎明时刻,国际知名AI专家吴恩达公开反对美国加州即将出台的SB-1047法案,指出其对开源人工智能模型的苛刻规定。他认为,该法案的根本错误在于试图监管开源大模型,而非基于这些模型的生成式AI产品。根据SB-1047,价值上亿美元的开源模型需提交年度安全报告,并对通过模型进行违法活动的开发者追究法律责任,这种类比于菜刀制造商因消费者犯罪而担责的法规被批评为荒谬。有趣的是,该法案意图限制中国使用Meta、谷歌等公司的开源模型参与生成式AI竞赛,但中国已有如阿里Qwen系列和零一万物Yi系列等受欢迎的开源大...

阿里通义Qwen2拿下美国最新测评榜单开源大模型全球第一

在人工智能领域,一项新的评测基准——LiveBench AI近日由图灵奖得主杨立昆及其合作机构推出,该基准对全球顶尖的开闭源大模型进行了评估。在首次发布的测评榜单上,阿里云通义千问的开源大模型Qwen2-72B脱颖而出,成为全球第一的开源大模型,且是中国唯一进入前十的模型,超越了Meta的Llama3-70B。GPT-4o虽然位居榜首,但Qwen2-72B作为开源模型的优异表现备受瞩目。 LiveBench AI的测评覆盖了34个领先模型,Qwen系列共有7款模型上榜,显示出强大的整体实力。除了Qwen2-72B外,还包括Qwen1.5的多个版本,它们是除GPT系列之外...

性能对标Llama 3,算力消耗仅1/19!源2.0-M32大幅提升模算效率

浪潮信息发布了开源大模型源2.0-M32,该模型基于MoE技术,拥有32个专家模块和400亿参数,但在运行时仅需37亿激活参数,大大降低了算力需求。相比700亿参数的Llama 3,源2.0-M32在训练、微调和推理过程中的算力消耗显著减少,实现了性能与效率的双重提升。在模型推理阶段,源2.0-M32的算力需求仅为Llama 3的1/19。此外,源2.0-M32在微调训练阶段的算力消耗也远低于Llama 3。通过算法结构创新,如门控网络技术和局部注意力过滤增强机制,源2.0-M32提升了模型精度,同时降低了算力消耗。浪潮信息致力于为企业提供更经济、高效的...

重建Meta帝国:用AI“回敬”TikTok

在2023年5月的美国白宫AI闭门会议上,Meta缺席引发了业界讨论。尽管如此,Meta通过开源大模型在AI领域取得突破,打破了OpenAI和谷歌的垄断,实现了AI界的“安卓时刻”。Meta的业绩增长得益于AI技术的运用,特别是在内容推荐和广告业务上的创新。例如,Meta利用AI创建了一个发现引擎,提高了内容理解与用户行为分析的精确度,增强了用户体验,从而增加了用户在Facebook和Instagram上的停留时间。此外,Meta的Reels功能对TikTok构成了竞争,用户增长逐渐恢复。 在广告业务方面,Meta面临苹果的隐私新规挑战,但随着中国电商如Te...

LobeChat支持通过网页版直接调用Ollama 本地模型 体验媲美ChatGPT

LobeChat,一款创新的网页平台,最近引起了关注。这个平台特别之处在于它允许用户直接在网页上利用Ollama本地模型进行互动,无需复杂的设置或第三方API。用户在安装了Ollama之后,便能与开源大模型如llama3、wizardLM、Gemma等进行无缝对话。LobeChat确保了高速的对话体验,只要用户的设备性能足够强大,其速度可比肩商业API。 在用户界面方面,LobeChat的设计简洁明了,提供与ChatGPT类似的优质体验。对于新用户,平台提供详尽的引导,帮助他们轻松上手。如果需要下载模型,LobeChat也提供了内置功能,使得整个过程更为便...

周鸿祎谈对“2024年AI产业发展的十六个趋势”预测

周鸿祎揭示2024年AI发展趋势:从开源大模型到人形机器人 在近日的一加ACE 3V手机发布会上,网络安全专家周鸿祎分享了他对2024年人工智能产业的展望。他预测,AI领域将迎来一系列重大变革,包括: 1. 开源大模型的繁荣,预示着大模型将在各个领域普及。 2. 云端超级大模型将成为大国间AGI竞赛的核心,模型规模将持续扩大。 3. 同时,小型化大模型将嵌入智能设备,赋予终端更多智能。 4. 企业级市场将见证垂直大模型的广泛应用,企业将拥有多个定制模型。 5. 多模态能力将成为大模型的关键,推动AIGC功能如文生图和视频的创...