游戏版《西部世界》来了!NPC 全由 AI 操控,行动自如有理想和记忆,基于最新 GAEA 技术系统打造

ChatGPT 彻底引爆了 AI 领域,也点燃了各赛道玩家的热情。
以虚拟交互体验为例,就已经有不少新产品冒头。
不仅像 Chat D-ID 这类以 ChatGPT 驱动的虚拟女友 bot 花样百出,就连游戏 AI NPC 也变得火热起来,这几天知名游戏公司育碧要推出 AI 工具 Ghostwriter 一事,更是引起了巨大关注。

不过这些都还只是用 AI 驱动单人 NPC 对话。
如果能用 AI 操控 NPC、甚至搭建出一个 AI 社会呢?
前不久,一个名为“活的长安城”的技术 Demo 引发讨论,其中 NPC 不仅全由 AI 操控,彼此之间还能互动:

要做的事也不会脱离性格和目标,如只想摸鱼翘班的捕快、立志当首席的舞女:

这场景,属实有点《西部世界》内味了!
但与《西部世界》不同的是,这些 NPC 没有预设剧本,也不会消除已有的“记忆”。

它究竟有何不同?又是如何运转起来的?
“活的长安城”,有何不同?
据上述 Demo 的发布方最新介绍,“活的长安城”是一个还在演进中的“AI 社会”,背后由一个名叫 GAEA 的技术系统驱动。
(之所以还在演进中,是因为它只运转了 30 天,更像是一个社会雏形)
而以“活的长安城”为代表的“AI 社会”具备以下特点:
包含一群身份多样、能互动的、受社会常识和反馈影响的 AI
这些 AI 的生活环境开放,能受交互反馈影响产生文明,反过来影响 AI 未来生活
这也导致在身处“AI 社会”的 AI NPC,与其他虚拟世界如游戏中的 NPC 有很大不同。
首先,与众多为剧情设计的 NPC 相比,AI NPC 有自己的目标和行动理由。
在不少游戏中,NPC 的目的只是引导用户走完剧情,即便用 AI 生成对话,这一目标也不会改变。

但“AI 社会”中的 NPC 不仅有各自的长期目标,当下也需要为生存等短期目标而考虑,换而言之,它们和人一样有需求,并根据性格和心情状态做出不同的行动。

此外,与其他游戏 NPC 不同的是,这些 AI NPC 还能“观察”其他角色的行动。
就像你走在大街上会观察路人一样,AI NPC 也会在一定范围内观察你和其他 NPC。如果有人吵架、或是举止异常,他们还会化身吃瓜群众上来围观。

最后,相比其他游戏 NPC,这些 AI NPC 拥有社会常识,能“记住”看见和做过的事,并影响之后的行动。
例如舞女决定对路人出手援助,是因为她没有遇到过“受骗”的事情。如果她目睹或经历了类似事件,那么 AI 就会降低她援助别人的几率。

这些特点,也导致了“AI 社会”不需要预设剧本,就能让 AI NPC 自己碰撞产生故事,积淀到社会中后又能回馈到 NPC 身上,反过来影响 AI NPC 的行动决策。
听起来很有意思,但具体到技术上,会发现实现起来并不简单。
拆解 GAEA 两大核心系统
从公开架构来看,GAEA 分为灵魂系统和环境系统两个子系统。

这其中,灵魂系统相当于 AI NPC 的大脑和行动中枢,环境系统则包含“AI 社会”的社会常识和物理信息等,它们彼此之间会相互影响交互。
先来看看灵魂系统,它被分为“记忆”和“策略”两部分。

“记忆”又分为内部状态和事件经历两个模块。内部状态用于建模 AI NPC 做事的“动机”,包含各种实时变化的状态值,如有钱就想摸鱼,不开心就想吵架:

事件经历则包括 AI NPC 一路观察或亲历的事情,用于给 AI NPC 的行动决策提供参考。例如 AI 小偷在大街上偷东西被捕快抓住过,它下次可能就不会在捕快出现的场景实施盗窃。
“策略”则分为上层宏观决策模型和下层交互模型。上层模型是一个长序列策略模型,它有点像 AI 的大脑,能够基于“记忆”中的社会常识信息+当下的环境系统做出决断,相当于给 AI NPC 制定一个整体计划:


下层交互模型则是通过符号系统建模的多任务模型,负责将上层模型做出的宏观决策进一步拆解细分,把整体计划变成一步步实际行动。
再来看看环境系统,它被分为“社会环境”和“物理环境”两部分。

“社会环境”包含了两方面的内容。
一方面,AI NPC 之间通过交互和反馈生成的语言行为关系等信息,会被记录在这个系统里,持续影响 AI NPC 灵魂系统做出的行为决策;
(当然,灵魂系统驱使 AI NPC 做出的行动,也会反过来交互中对环境系统产生影响,形成系统自运转)

另一方面,它包含了运转“AI 社会”所需要的所有人类社会常识,例如带有人类社会含义的状态标签(快乐、希望、金钱等)就包含在这个库中,而社会知识和规则也纳入其中。

“物理环境”就是场景中的各种物理数据了,包括风景建筑和商品水果等实物的建模信息、以及其他 NPC 的物理建模数据等,让 NPC 知道能与哪些场景数据发生交互,并指引它们做出具体的行动。

但即便 GAEA 背后的技术原理已经透露,具体如何实现让 AI NPC“更像人”的效果,又是哪些关键技术提升了它的剧情生成细节,仍然是一个未知数。
带着这些问题,我们找到了 GAEA 背后的团队——超参数科技。
据其项目负责人张弛介绍,GAEA 综合了不同模型能力,研发周期比想象中要长,大致分为两阶段:阶段一是搭建出完整的迭代场景和技术框架,也就是 GAEA1.0;阶段二是着重提升 GAEA 的剧情生成和自然语言交互能力。
阶段一,团队主要依靠自研的 AI BOT 技术和长期实践积累的工程能力,一步步完成 GAEA 的技术选型,让虚拟场景“长安城”自运转起来。
这一阶段,不仅需要着重提升 AI NPC 的能力,包括丰富的行为表现和自然的语言交流等,来让它们看起来“更像人”,还需要不断改进技术方案和迭代路线,相当于将实验室的内容落地。在张弛看来,后者尤其难,不仅要考虑技术落地,还要具备从系统的角度思考整个 NPC 生态的产品思维。
他举例说,光是让 NPC 看起来“更像人”,涉及到的技术就不少。比如,让 NPC 根据昼夜等常识概念做出合理行动,涉及到模型对社会常识的理解与推理能力;给 AI 赋予“理想”和生存等现实目标,则要考虑建模 NPC 内在动机;而支撑 NPC 海量的行为表现,需要用到多任务强化学习等技术;而有效“记忆”信息提取,得通过特殊的编解码方式来解决……
阶段二,在系统已经能完整运转的基础上,团队引入了大语言模型来提升系统的生成效果。正如原理框架中展示,大模型提升了原有 GAEA 在目标拆解、AI 常识推理和对话等模块上的能力,进一步提升系统的“转速”。

谈及下一步,张弛也做了小小透露,他说团队计划持续优化 GAEA 的技术细节,利用大模型去进一步提升 NPC 与真人交互的能力,以及整个生态的剧情生成能力,并对其他方向的 AI NPC 技术做一些预研布局。
当然,如何将 GAEA 输出到轻量化、可感知的产品上,建立合作机会,也是他们正在思考的方向。
公开资料显示,在推出 GAEA 之前,超参数科技已在“AI+游戏”领域取得成绩,包括率先在在 3D FPS 领域实现大规模商业化落地,AI bot 在多款千万日活的头部产品中稳定运营,已经部署到全球 50 多个国家及地区等。
AIGC 催生产业变革浪潮
AIGC 这波浪潮推动下,各行各业正在迎来新一轮 AI 变革节点。
正如比尔·盖茨在《人工智能时代已开启》文章中所言,AI 的到来将会极大地提升社会生产力,从而进一步改变人与人之间的交互方式:
整个行业都会围绕它重新定义。
一方面,AI 的到来正在不断地提升社会生产力。
以大模型为例,它正在改变很多行业的工作方式、未来甚至能极大地提升行业的工作效率。
另一方面,对于产业本身而言,AI 的出现又改变了人与人之间的交互方式,从而带来产品的新一轮爆发。
在红杉资本两位合伙人与 GPT-3 联合撰写的一篇名为 Generative AI:A Creative New World 的文章中,更是预测 AIGC 技术会如当年移动通信一样,诞生一轮“杀手级应用”。

简而言之,这些新技术的出现,不仅会给产品开发过程带来变革,催生出产品交互方式、乃至于产品本身的进化,甚至带来 AI 原生产品。
至于如何应对这波 AIGC 浪潮?有玩家选择 All in 新技术,开辟新场景;也有玩家质疑新技术应用前景,选择再观望一波。
超参数科技 GAEA 项目负责人张弛接受采访时表示:
随着技术迭代,市场的不断竞争,我相信大模型的调用成本一定会持续降低。
因此,现阶段该聚焦的还是如何在原有技术积累上用好大模型,做出完全不同以往的东西,给游戏或未来产品带来新的可能性。
萧箫 发自 凹非寺
本文源自:“量子位”公众号
卡奥斯开源社区是为开发者提供便捷高效的开发服务和可持续分享、交流的 IT 前沿阵地,包含技术文章、群组、互动问答、在线学习、大赛活动、开发者平台、OpenAPI 平台、低代码平台、开源项目等服务,社区使命是让每一个知识工人成就不凡。
评论