谷歌震撼发布Gemma 2:270亿参数开源AI模型,极致推理效率引领业界,轻松运行于A100 / H100 GPU

谷歌近日向全球的研究者和开发者推出了全新的Gemma 2语言模型,该模型具有两个版本,分别拥有90亿和270亿参数,相较于前一代,它在性能和效率上有了显著提升,同时在安全特性上取得了重要进展。据谷歌介绍,Gemma 2-27B模型的性能可与双倍规模的主流模型匹敌,但只需一片英伟达H100 Tensor Core GPU或TPU主机即可支持,大大降低了部署成本。对于资源有限的环境,谷歌即将推出26亿参数的Gemma 2模型,特别适合智能手机等AI应用。

Gemma 2的架构经过全面优化,旨在提供出色的性能和推理效率。27B版本在同类产品中表现出色,超越了两倍大小的模型。9B版本同样在同级别中领先,超过了Llama 3 8B等开源模型。此外,27B模型能在单个谷歌云TPU主机或特定GPU上以全精度高效运行,降低了运行成本,使AI部署变得更加便捷和经济。

为了适应不同硬件,Gemma 2被设计成能在从游戏笔记本到云端服务器的各种设备上快速运行推理。用户可以在Google AI Studio体验全精度的Gemma 2,或者在装有NVIDIA RTX或GeForce RTX的个人电脑上利用Hugging Face Transformers进行尝试。

请注意,本文中提及的外部链接仅用于传递信息,可能节省读者查找时间,内容仅供参考。IT之家的所有文章遵循这一声明。

本文来源: IT之家【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...