谷歌推出Gemini 2.0最强模型，引领AI Agent风暴，Trillium TPU助力Project Astra与Project Mariner挑战OpenAI

谷歌发布Gemini 2.0，多模态输出与AI Agent引领新时代
近日，谷歌在其年度技术大会上宣布推出了最新的AI大模型Gemini 2.0。这款模型不仅在性能上有了显著提升，还引入了多模态输出和原生调用谷歌搜索、地图、Lens等工具的功能。Gemini 2.0的发布标志着谷歌在AI Agent领域的重大突破。

Gemini 2.0 Flash：速度翻倍，专为AI Agent设计
Gemini 2.0 Flash是Gemini 2.0的第一个实验版本，其速度是1.5 Pro的两倍。谷歌表示，这款新模型专为AI Agent时代而设计，支持多模态输出，包括图像生成和音频输出。此外，Gemini 2.0 Flash还能原生调用谷歌的各种工具，为用户提供更加丰富的交互体验。

AI Agent新品：Project Astra、Project Mariner、Jules和游戏Agent
基于Gemini 2.0 Flash，谷歌推出了一系列AI Agent新品：
– Project Astra：一款通用AI助手原型，能够实时处理文本、图像、视频和音频，支持多国语言，具备强大的记忆和对话能力。
– Project Mariner：能够在浏览器中完成多步骤复杂任务的AI Agent，目前最佳工作结果达到83.5%。
– Jules：直接集成到GitHub工作流程中的AI编程Agent，能够在开发人员的指导下解决问题和执行任务。
– 游戏Agent：帮助用户在视频游戏中导航，根据屏幕上的动作进行推理并提供实时建议。

安全与隐私：确保用户信息安全
谷歌在安全方面投入了大量精力，通过迭代实施安全培训、与测试人员和外部专家合作，进行广泛的风险评估。Gemini 2.0的多模态功能增加了潜在输出的复杂性，谷歌将继续评估和训练模型，以提高安全性。此外，谷歌还通过Project Astra和Project Mariner等项目，探索保护用户敏感信息和遵循用户指令的策略。

Trillium TPU：谷歌最强AI芯片普遍可用
Gemini 2.0的背后功臣是谷歌的第六代TPU——Trillium TPU。这款芯片在训练性能、推理吞吐量和能效等方面都取得了显著提升。Trillium TPU现已面向谷歌云客户普遍可用，为AI训练和推理提供了强大的支持。以色列AI大模型独角兽AI21 Labs已使用Trillium来加速开发下一代复杂语言模型。

结语：大模型竞赛进入新阶段
随着Gemini 2.0的发布，谷歌在大模型竞赛中占据了领先地位。从亚马逊、OpenAI、Meta到谷歌，各大科技巨头纷纷推出重磅产品，推动了通用人工智能（AGI）的发展。谷歌通过在大模型、云端基础设施和端侧智能方面的优势，进一步强化了AI Agent在智能手机、智能眼镜等设备上的应用前景。然而，AI系统仍存在不可控性，谷歌和其他大模型公司必须确保低风险，控制好安全的方向盘。

本文来源：