惊了，GPT也会玩《黑神话》？胜率还远超人类？全靠大模型实力！

发表于 2024-09-22 更新于 2024-12-10 阅读次数：

这篇文章介绍了阿里巴巴研究人员开发的新型VARP智能体框架，能够通过分析游戏截图生成Python代码形式的动作，以操作游戏。以《黑神话·悟空》为例，该智能体在90%的简单和中等水平的战斗场景中取得了胜利。文章指出，尽管AI在处理某些任务时表现出色，但在面对更复杂的挑战时仍存在局限性，并强调了AI在游戏中的表现受多种因素影响。

【重要】推荐使用 Wildcard虚拟信用卡订阅GPT、Sora等服务，价格更便宜、卡片有效期更长、支持的服务更多，具体教程请查看：Wildcard教程

其他精选文章

类别	教程
Claude	如何解决Claude账号被封，及Claude3使用方法、【重要】如何注册Claude3？
Sora	【保姆级】体验Sora模型的官方途径、【精华】4000字搞懂sora！
ChatGPT	【包教包会】国内ChatGPT账号注册教程、【绝对管用】教你一键注册官方GPT账号！
Midjourney	【推荐】midjourney注册方式
Poe	【保姆级】Poe订阅问题看这一篇就够了
Suno	【推荐】Suno用法和订阅一文详解！
其他	【一看就会】Overleaf升级保姆级教程、【保姆级】如何订阅Youtube Premium？、更多精彩

导语

《黑神话：悟空》这款游戏，以其独特的东方魅力和引人入胜的剧情，在玩家和业界中引发了巨大的热潮。它不仅在界内十分火爆，更是火出了圈，可以在各处看见他的身影，包括奶茶店、咖啡店、商场超市等。这款游戏凭借其精致的画面和深入人心的角色塑造，无疑将为中国游戏产业注入新的活力，让人们看见了中华文化的博大精深，不禁感叹：祖宗优选才是好货！

然而，最近胖虎竟然发现：AI也能直面天命！GPT可以玩《黑神话·悟空》！

AI竟然在《黑神话：悟空》中打败了人类玩家！这可不是什么小打小闹，而是完完全全的大招！它不仅赢了，还赢得超级漂亮，特别是在对抗鸦香客和牯护院时，简直像开了挂一样！而且，这全靠一个大模型，没有使用强化学习！

阿里巴巴的研究人员们真的太牛了，他们提出了一种新型的VARP智能体框架。这个框架可以直接分析游戏截图，然后通过视觉语言模型推理，生成Python代码形式的动作来操作游戏。在《黑神话·悟空》中，这个智能体在90%的简单和中等水平的战斗场景中取得了胜利！

GPT-4o、Claude 3.5都不缺席挑战

研究人员以《黑神话·悟空》为研究平台，一共定义了12个任务，75%与战斗有关。

他们构建了一个包含1000条有效数据的人类操作数据集，这些数据囊括了键鼠操作和游戏截图。每个操作都是由一系列原子命令组成的，比如轻攻、闪避、重攻击和回血等。

他们提出了VARP智能体框架，主要包括动作规划系统和人类引导轨迹系统。

动作规划系统由情境库、动作库和人类引导库组成，使用VLMs进行动作推理和生成，并引入辅助模块以分解特定任务以及自我优化的动作生成模块。

人类引导轨迹系统则利用人类操作数据提升智能体性能，针对复杂任务，通过查询人类引导库获取相似截图和操作，生成新的引导动作。

同时，VARP还包括三个库：情景库、动作库和人工引导库。

这些库存储了智能体自我学习和人类指导的内容，能够进行检索和更新。动作库中，“def new_func_a()”表示动作规划系统生成的新动作，“def new_func_h()”代表人导轨迹系统生成的动作，而“def pre_func()”则是预定义的动作。

动作案例研究和相关游戏截图中，第一行和第二行的操作是预定义函数，第三行的动作由人工引导轨迹系统生成。SOAG会在每次玩家角色与敌人战斗互动后，总结第四行和第五行中的新动作，并将其存储在动作库中。

框架分别使用了GPT-4o（2024-0513版本）、Claude 3.5 Sonnet和Gemini 1.5 Pro。

对比人类和AI的表现结果发现，在小怪部分，AI的表现达到了人类玩家的水平。然而，当进入牯护院时，Claude 3.5 Sonnet表现不佳，而GPT-4o的胜率最高。

但对于新手玩家普遍感到棘手的幽魂，AI们也无能为力。

还有研究指出，由于VLMs的推理速度限制，它无法实时处理每一帧画面，只能间隔输入关键帧，这可能导致AI错过boss攻击的关键信息。此外，由于游戏缺乏明确的道路引导且存在许多空气墙，智能体在没有人类指导的情况下也无法找到正确的路线。这项研究由阿里团队的五位作者完成。

后续相关代码和数据集有发布计划，感兴趣的朋友可以蹲下。

最后

我想说，AI的潜力是无限的，欢迎关注我的公众号：AI小鲨，持续为您带来最新AIGC资讯！

参考原文：GPT也会玩《黑神话》？胜率还远超人类？全靠大模型实力！

你好，我是进击的胖虎

亲爱的读者你好！我是进击的胖虎。欢迎扫描二维码关注我们的公众号（最新文章都在公众号里），我将带你从零基础出发，逐步掌握各种AI工具的操作技巧，并为你解读最新的热点新闻！