谷歌DeepMind推出Genie 2，开启机器人训练与AI模型发展新篇章：虚拟环境中的创新突破

整理后文章

谷歌DeepMind在机器人训练领域取得了突破性进展，其最新推出的AI模型 Genie 2展现出了巨大的潜力。这一技术不仅能够从单一静态图像生成可探索的3D虚拟世界，还为AI代理和机器人提供了逼真的模拟环境。

据DeepMind CEO兼联合创始人Demis Hassabis介绍，Genie 2的核心优势在于创建交互式3D环境以及加速机器人学习的能力。在《60分钟》节目的演示中，DeepMind的研究科学家Jack Parker-Holder展示了一项令人惊叹的功能：一张加州瀑布顶部的照片被转化为类似第一人称视角的视频游戏场景。用户或AI代理可以在虚拟环境中自由移动，甚至探索原始图像中不存在的景观。

Hassabis表示，Genie 2的“世界模型”能够动态生成环境，并模拟现实世界的物理特性。这种能力不仅适用于娱乐领域（如生成游戏和视频），更重要的是为AI和机器人提供了一个高效的训练平台。传统的机器人数据采集受限于现实世界的复杂性和高成本，而Genie 2的模拟环境可以生成近乎无限的数据量，允许机器人在虚拟世界中进行初步学习，随后通过少量现实世界数据进行微调。

在一次演示中，AI控制的骑士角色在一个由Genie 2生成的3D环境中自主完成了任务，例如从三个门廊中选择正确路径并爬上楼梯。Hassabis指出，这种技术可以让机器人在模拟环境中学习复杂任务，如导航、物体交互和决策制定，从而大幅减少对现实世界数据的依赖。

此外，DeepMind正在探索利用谷歌地图、谷歌地球和街景视图等地理数据，进一步增强AI的世界理解能力。这些数据可以为AI提供丰富的现实世界背景，帮助机器人更好地适应真实环境。同时，Genie 2还能将静态图像（如街景或个人度假照片）转化为交互式3D场景，为机器人训练和用户体验开辟了新的可能性。

展望未来，Hassabis透露，下一代Genie模型将能够创建更多样化、复杂的虚拟世界，为机器人学习新技能、执行任务以及与人类和物体交互提供支持。这一技术不仅有望革新机器人开发，还可能在工业、医疗和探索等领域推动智能化应用的广泛普及。

本文来源：