标签:浪潮信息

性能对标Llama 3,算力消耗仅1/19!源2.0-M32大幅提升模算效率

浪潮信息发布了开源大模型源2.0-M32,该模型基于MoE技术,拥有32个专家模块和400亿参数,但在运行时仅需37亿激活参数,大大降低了算力需求。相比700亿参数的Llama 3,源2.0-M32在训练、微调和推理过程中的算力消耗显著减少,实现了性能与效率的双重提升。在模型推理阶段,源2.0-M32的算力需求仅为Llama 3的1/19。此外,源2.0-M32在微调训练阶段的算力消耗也远低于Llama 3。通过算法结构创新,如门控网络技术和局部注意力过滤增强机制,源2.0-M32提升了模型精度,同时降低了算力消耗。浪潮信息致力于为企业提供更经济、高效的...

快速低成本构建应用,浪潮信息把企业大模型落地门槛打下来了

浪潮信息推出企业大模型开发平台元脑企智EPAI,旨在降低企业应用大模型的门槛。随着大模型进入2.0时代,算力、数据和算法成为关键,但高昂的成本和行业知识不足阻碍了落地。EPAI提供端到端解决方案,包含基础数据、自动化工具、高效微调功能,支持长文档处理,解决行业数据缺乏和模型幻觉问题。平台的易用性使得不同技术水平的开发者能快速上手,降低企业用工成本。EPAI还注重数据安全,确保模型和数据的安全。浪潮信息的全面布局,包括算力、存储和互联,将进一步推动大模型产业协作,促进大模型的普及和产业化落地。

AI算力风起“云”涌,紫光股份4天3板,中科曙光成交再超百亿,云计算ETF(159890)带量飚涨4.7%

2024年3月1日,AI领域热度不减,计算机、软件和互联网股票表现出色。星环科技-U涨幅显著,达16.66%,紫光股份强势4天内3次涨停,浪潮信息封板,中科曙光上升7.62%,成交额连续三日破百亿。新易盛、国网信通、中国软件和科大讯飞等同样录得可观增长。 云计算ETF(159890)劲升4.70%,收盘价为0.957元,成交金额增加。过去四日,该ETF净流入资金约4653万元,净流入率超过52%。计算机板块吸金超130亿,近五日累计净流入248亿,成为申万一级行业首位。 2月6日至3月1日,计算机行业指数上涨35.89%,云计算与大数据主题指数飙升3...