GPT-4助力《黑神话·悟空》游戏体验：AI视觉语言模型驱动的游戏智能体框架实现精英怪胜率超越人类玩家，纯大模型方案无需强化学习

近年来，AI技术在游戏领域的应用越来越广泛。最近，一项新的研究表明，AI不仅能够流畅地玩《黑神话·悟空》，还能在某些场景中取得比人类更高的胜率。这项研究由阿里巴巴的研究团队完成，并提出了一种名为VARP（视觉动作角色扮演）智能体框架，该框架通过视觉语言模型（VLMs）直接处理游戏截图并生成相应的Python代码来操控游戏。

在《黑神话·悟空》这款游戏中，研究人员定义了12个任务，其中75%与战斗相关。为了验证VARP框架的有效性，他们构建了一个包含1000条有效数据的人类操作数据集，其中包括键鼠操作和游戏截图。每个操作都是由原子命令的组合构成，例如轻攻击、闪避、重攻击、回血等。

VARP框架主要由动作规划系统和人类引导轨迹系统组成。动作规划系统包括情境库、动作库和人类引导库，通过VLMs进行动作推理和生成，并引入了辅助模块来分解特定任务。人类引导轨迹系统则利用人类操作数据来改进智能体的性能，对于复杂任务，通过查询人类引导库来获取相似截图和操作，生成新的人类引导动作。

此外，VARP框架还包含三个库：情境库、动作库和人工引导库。这些库中存储了智能体自我学习和人类指导的，可以进行检索和更新。动作库中包含了多种动作类型，包括动作计划系统生成的新动作、人工引导轨迹系统生成的动作以及预定义的动作。

研究人员使用了GPT-4o、Claude 3.5 Sonnet和Gemini 1.5 Pro三种模型进行了实验。结果显示，在简单的战斗场景中，AI的表现达到了人类玩家的水平。然而，在面对更复杂的敌人时，如牯护院，只有GPT-4o表现最佳。但对于新手玩家来说较难对付的幽魂，所有AI模型都无法应对。

尽管如此，由于VLMs的推理速度受限，无法实时输入每一帧画面，只能间隔输入关键帧，这导致AI在某些情况下会错过关键信息。此外，由于游戏中缺乏明确的道路引导且存在空气墙，智能体在没有人类引导的情况下无法自行找到正确的路线。

这项研究由阿里巴巴团队完成，共有五位作者参与。未来，相关的代码和数据集有望公开，感兴趣的研究者可以关注后续动态。

AI在游戏领域的发展一直在持续进步。此前，基于强化学习的方法已经在《星际争霸II》中击败了人类职业选手。相比之下，这项研究仅使用了1000条有效数据，就能实现不错的游戏表现，这无疑是一个令人惊讶的结果。

论文地址：[https：//arxiv.org/abs/2409.12889](https：//arxiv.org/abs/2409.12889)
项目地址：[https：//varp-agent.github.io/](https：//varp-agent.github.io/)

本文来源：

量子位【阅读原文】

# 每日AI快讯 # AI # GPT-4o # 游戏智能体框架 # 视觉语言模型 # 黑神话·悟空

文章版权归作者所有，未经允许请勿转载。

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GPT-4助力《黑神话·悟空》游戏体验：AI视觉语言模型驱动的游戏智能体框架实现精英怪胜率超越人类玩家，纯大模型方案无需强化学习

用AI干预老年痴呆治疗！微软联合上海“600号”

李飞飞在a16z最新对话中探讨生成式AI与深度学习：空间智能无缝衔接虚拟与现实世界，World Labs引领未来AI技术革新及多元应用

相关文章

暂无评论

AI最新资讯