谷歌推出Gemini 2.0最强模型,引领AI Agent风暴,Trillium TPU助力Project Astra与Project Mariner挑战OpenAI
谷歌发布Gemini 2.0,多模态输出与AI Agent引领新时代
近日,谷歌在其年度技术大会上宣布推出了最新的AI大模型Gemini 2.0。这款模型不仅在性能上有了显著提升,还引入了多模态输出和原生调用谷歌搜索、地图、Lens等工具的功能。Gemini 2.0的发布标志着谷歌在AI Agent领域的重大突破。
Gemini 2.0 Flash:速度翻倍,专为AI Agent设计
Gemini 2.0 Flash是Gemini 2.0的第一个实验版本,其速度是1.5 Pro的两倍。谷歌表示,这款新模型专为AI Agent时代而设计,支持多模态输出,包括图像生成和音频输出。此外,Gemini 2.0 Flash还能原生调用谷歌的各种工具,为用户提供更加丰富的交互体验。
AI Agent新品:Project Astra、Project Mariner、Jules和游戏Agent
基于Gemini 2.0 Flash,谷歌推出了一系列AI Agent新品:
– Project Astra:一款通用AI助手原型,能够实时处理文本、图像、视频和音频,支持多国语言,具备强大的记忆和对话能力。
– Project Mariner:能够在浏览器中完成多步骤复杂任务的AI Agent,目前最佳工作结果达到83.5%。
– Jules:直接集成到GitHub工作流程中的AI编程Agent,能够在开发人员的指导下解决问题和执行任务。
– 游戏Agent:帮助用户在视频游戏中导航,根据屏幕上的动作进行推理并提供实时建议。
安全与隐私:确保用户信息安全
谷歌在安全方面投入了大量精力,通过迭代实施安全培训、与测试人员和外部专家合作,进行广泛的风险评估。Gemini 2.0的多模态功能增加了潜在输出的复杂性,谷歌将继续评估和训练模型,以提高安全性。此外,谷歌还通过Project Astra和Project Mariner等项目,探索保护用户敏感信息和遵循用户指令的策略。
Trillium TPU:谷歌最强AI芯片普遍可用
Gemini 2.0的背后功臣是谷歌的第六代TPU——Trillium TPU。这款芯片在训练性能、推理吞吐量和能效等方面都取得了显著提升。Trillium TPU现已面向谷歌云客户普遍可用,为AI训练和推理提供了强大的支持。以色列AI大模型独角兽AI21 Labs已使用Trillium来加速开发下一代复杂语言模型。
结语:大模型竞赛进入新阶段
随着Gemini 2.0的发布,谷歌在大模型竞赛中占据了领先地位。从亚马逊、OpenAI、Meta到谷歌,各大科技巨头纷纷推出重磅产品,推动了通用人工智能(AGI)的发展。谷歌通过在大模型、云端基础设施和端侧智能方面的优势,进一步强化了AI Agent在智能手机、智能眼镜等设备上的应用前景。然而,AI系统仍存在不可控性,谷歌和其他大模型公司必须确保低风险,控制好安全的方向盘。