性能对标Llama 3，算力消耗仅1/19！源2.0-M32大幅提升模算效率

每日AI快讯10个月前发布 AI部落小助手

476 0 0

浪潮信息发布了开源大模型源2.0-M32，该模型基于MoE技术，拥有32个专家模块和400亿参数，但在运行时仅需37亿激活参数，大大降低了算力需求。相比700亿参数的Llama 3，源2.0-M32在训练、微调和推理过程中的算力消耗显著减少，实现了性能与效率的双重提升。在模型推理阶段，源2.0-M32的算力需求仅为Llama 3的1/19。此外，源2.0-M32在微调训练阶段的算力消耗也远低于Llama 3。通过算法结构创新，如门控网络技术和局部注意力过滤增强机制，源2.0-M32提升了模型精度，同时降低了算力消耗。浪潮信息致力于为企业提供更经济、高效的大模型解决方案，通过全面开源开放推动大模型的普及。

本文来源：

智东西【阅读原文】

# 每日AI快讯 # MoE模型 # 开源大模型 # 浪潮信息 # 源2.0-M32 # 算力效率

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

Meta紧急应对开源大模型DeepSeek，高预算投入AI创新引发内部恐慌，英伟达技术助力深度分析

AI部落小助手

474

大模型行业探析：真正的‘开源大模型’是否存在？对比审视开源大模型与闭源模型，如Llama 3.1与Mistral Large2的发展趋势

AI部落小助手

459

吴恩达反对SB-1047法案：开源大模型与AI创新的潜在危机，生成式AI何去何从?

AI部落小助手

455

刚刚，Mistral AI最新磁力链放出！8x22B MoE模型，281GB解禁

AI部落小助手

606

首个国产音乐SOTA模型来了！专为中文优化，免费用，不限曲风

AI部落小助手

505

LobeChat支持通过网页版直接调用Ollama 本地模型体验媲美ChatGPT

AI部落小助手

1,059

暂无评论

您必须登录才能参与评论！

暂无评论...