谷歌最强开源模型Gemma 2发布！270亿参数奇袭Llama 3，单张A100可全精度推理

谷歌在I/O Connect大会上推出了其最新的开源模型Gemma 2，这款模型拥有90亿和270亿两种参数规模，其中27B模型在LMSYS Chatbot Arena中表现出色，击败了700亿参数的Llama 3。Gemma 2在性能、推理效率和安全性方面都有显著提升，26亿参数的版本甚至可以在手机上本地运行。

相较于前一代，Gemma 2在架构上进行了重新设计，采用了交替的局部-全局注意力机制和知识蒸馏技术。此外，Gemma 2还支持多种AI框架，如Hugging Face Transformers，便于开发者和研究人员部署。

为了提高效率和降低成本，Gemma 2 27B模型能在单个GPU或TPU上高效运行全精度推理。同时，Gemma 2在MMLU、AGIEval和HumanEval等基准测试中表现出色。谷歌还提供了负责任的AI开发资源，包括LLM Comparator工具，以评估模型的安全性。Gemma 2将在Vertex AI上供谷歌云客户使用，且用户可以通过Gemma Cookbook学习如何构建和微调应用。

本文来源：

智东西【阅读原文】

文章版权归作者所有，未经允许请勿转载。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

谷歌最强开源模型Gemma 2发布！270亿参数奇袭Llama 3，单张A100可全精度推理

面向终端侧生成式AI规模化扩展，高通重新定义SoC系统性能

中金公司预测：未来十年，AI大语言模型引领的通用化技术将大幅提升采矿、医疗等行业生产率，推动就业结构转型

相关文章

暂无评论

AI最新资讯