游戏,作为文化与科技结合的产物。不光充当着各类创意的试验田,也是前沿科技最佳落地场景之一。过去一年,大模型以及AIGC技术的突破和演进,为游戏行业带来了巨大变化,不仅改变了游戏开发流程,也为整个游戏行业带来了更大的想象空间。
想象一下,玩家可以在游戏中与NPC进行拟人、即兴且动态的对话,这些角色还具有随时间演变的不同个性,以及准确的面部动画和表情——真正让《西部世界》《失控玩家》的剧情照进现实,玩家可以在虚拟世界获得良好体验和沉浸感。
如今这不再只是浪漫的幻想,随着AIGC革新传统游戏内容体验,理想中的智能NPC似乎不再遥不可及。随着英伟达、网易等越来越多头部企业下场,越来越多游戏中的NPC将被AI赋予“灵魂”。
AI浪潮翻涌,不容忽略的智能NPC
去年5月COMPUTEX 2023上,英伟达发布新AI技术Omniverse Avatar Cloud Engine(ACE)。这是一套实时AI解决方案,能够为游戏中的语音、对话和角色动画提供AI模型,即为NPC添加实时交互功能。英伟达称:“该服务通过AI驱动自然语言交互为NPC带来智能,从而改变游戏”。
最近,英伟达性能技术副总裁 John Spitzer 还公开表示,所有开发人员都对 AI 影响游戏开发过程的方式感兴趣。他将为 NPC 的一个关键测试提供硬件支持。
AI对于游戏行业是一个巨大的机遇,将给游戏开发商和游戏运营公司带来无限的可能性,已经被越来越多的企业所认可。EA的技术合作关系主管Jeff Skelton曾公开表示,AI将成为游戏行业向前发展的标配。成熟的AI工具,能直接作用于游戏设计、建模、增加表情、语音甚至动作。基于AI角色扮演能力而诞生的智能NPC,可以说是AIGC在游戏中的前沿应用。
NPC作为游戏世界观的载体,是提高玩家代入感的一个重要工具。过去十年,在玩法创新和玩家画面体验边际递减的背景下,NPC作为故事情节的推动者及玩家体验的伴侣,地位越来越高。
类似《巫师3》《荒野大镖客2》《赛博朋克2077》,游戏中的NPC展现出了极强的自由性。它们不仅仅是背景元素,也是故事的重要组成部分,为叙事增添了深度和现实感。不过,这些产品实现这一效果背后的逻辑依旧古早,即通过团队大量的“堆人”,利用海量脚本实现这一效果。
《荒野大镖客 2》中有超过 1000 个 NPC 角色,分布在 6 个章节的 100 多个任务中。每个 NPC 都有自己的歌手、美术作者和配音演员,这些NPC的制作耗时近 8 年、研发成本接近 5 亿美元。
尽管如此,研究显示,52% 的玩家都在抱怨目前的 NPC「只会重复对话」,99% 的玩家在期待更智能的 NPC,甚至有 81% 的玩家愿意为其支付更多费用。
而大模型的出现有望改变当下NPC的制作流程和游戏体验,事实上以《逆水寒》手游为代表的产品,已经走在了将大模型融入游戏的最前沿,使用AI角色模型有效提升了游戏的沉浸感。部分游戏内NPC的交互实现了千人千面的效果,为玩家带来个性化的游戏体验。
与此前脚本驱动的NPC不同,这些AI驱动的智能NPC能根据玩家的对话作出决策、对玩家行为给与实时反应,甚至是展现出一些类似人类的情感。这一进步使得游戏世界更加真实、互动性也更强,每个NPC都能为提升游戏的叙事深度和互动维度,提供独特且动态的贡献,从而增强玩家的沉浸感。
这两年,行业步入精品化时代,全球游戏市场竞争加剧,跨平台、开放世界等超大型制作开始主导市场。随着游戏变得越来越复杂,NPC的创作也在不断升级,智能NPC的重要性已经不言而喻。
AI NPC融入游戏行业?很多问题亟待解决
宏观视角下,智能NPC的存在将会彻底改变传统游戏内容体验,尤其是RPG等重剧情的内容型产品。
届时,玩家不再只身处一个预设导航的世界,相反,他们将和可以学习、适应并实时反馈的拟人化角色互动,这种互动也将为游戏叙事带来前所未有的深度。玩家的每一个决策和行动,都可能导致多样化和意想不到的结果。
虽然智能NPC的前景非常美好,当下大语言模型技术也正处于高速发展阶段,但将之集成到成熟的游戏研发环节,依旧充满挑战。
首先,智能NPC当下最大的短板必然是“不够拟人”。无论GPT-4、 Claude2.1,还是专注于智能NPC的Inworld等平台,虽然角色生成能力非常强大,但玩家在与它们生成的角色对话互动的过程中,都能清晰察觉到这些角色行为和情感上与人类的差别。
这种不足可能会破坏玩家与“真实”角色互动的感觉,从而降低沉浸感。
其次,截止到现在,大模型的应用时间不足两年,很多基于大模型的AI平台和工具在使用成本和平台易用性上,还有明显的不足。
一方面,高质量的AI工具和平台API调用费用昂贵,中小开发者难以受用,巨大的经济门槛限制了前沿AI技术在行业内的迅速普及。另一方面,多数AI平台并非专为游戏设计。缺乏行业特定案例和优化配置,开发者难以将这些工具无缝集成到游戏中。
此外,API稳定性、对话令牌(Token)的最大数量限制等,都在不同程度上阻碍着AI技术融入游戏产业。即使是GPT-4这样的先进工具, Token的限制依然制约着用户与NPC对话的深度和长度,这会导致AI在对话中经常忘记与用户最初的谈话内容。在追求稳定表现的商业应用中,其负面效果只会愈发突出。毕竟长篇复杂的对话,对于游戏内故事讲述和角色发展至关重要。
如何解决这些挑战,对于充分释放AI在创造真正沉浸、动态和高互动游戏体验的潜力至关重要。
AI应用未来:满足开发者和行业需求
对此,不少海内外企业、包括AI大模型公司,都在探索可行的路径,如Claude2.1的200K最大Tokens、英伟达的ACE for Games等。1月9日,国内AI初创公司百川智能也在智能NPC上踏出重要一步,发布了Baichuan-NPC角色模型及百川角色创建平台,为AI与游戏产业的融合带来新可能,引起行业热议。
百川智能角色创建平台官网
之所以引发广泛关注,最主要的原因是它解决了上文提到的各种短板。这也引出了一个需要我们重新探讨的问题:AI大模型和平台在游戏行业商业化应用时,究竟需要具备哪些素质?
第一,对于智能NPC来说,最重要的是演的“像不像”的问题。
就像天赋异禀的人类的演员能够很好的塑造角色一样,智能NPC演的像不像,首先要看基础模型是否足够聪明,也就是模型的通用智能水平是否足够。而模型的智能水平通常由预训练决定,不过相比通用模型,游戏智能NPC属于垂直大模型应用,意味着其背后的大模型不仅需要复杂的通用文本数据,还需要大量的高质量对话、丰富的情节叙述等内容,围绕“角色扮演”进行针对性训练,从而在对话中展现一种高度拟人感。
而为了更好地提升模型效果,百川智能早在预训练阶段就从多维度对底座模型进行优化。一方面收集海量行业网站、高质量书籍、优质剧本数据,对Baichuan-NPC进行超过3T Tokens的领域知识预训练;另一方面,Baichuan-NPC创新性使用人工合成数据进行预训练阶段的领域知识增强,大幅度提升Token利用效率。
预训练过程中一个很重要的点是,由于数据占比存在差异,预训练阶段模型基础能力和各专项能力的增长曲线,其实并不一致。换言之,即使在预训练中加入了一定数量优质的小说对白、剧本对话等数据,角色模型的“扮演”效果不一定会与模型的通用能力同步提升。对此,百川智能提出了关注能力平衡的课程学习方法,以自适应方式动态调控不同阶段的数据分布,保持模型基础能力和专业能力平衡。通俗理解就是,这种课程学习方法能够让模型像人一样学习成绩和文艺、体育成绩共同进步,均衡发展。
基座模型能力提升当然重要,但角色模型在落地应用过程中,往往还面临着“身份一致性”的阻碍。即基于通用语言模型构建的NPC经常会在对话过程中,出现角色知识、背景常识、行为习惯、语气风格背离人设的情况。比如,我们问大模型扮演的“李白”“开飞机应该注意哪些问题?”,他会就“飞机”这个现代的事物侃侃而谈,而不是告诉我们他并不知道飞机是什么。
这种现象大多源自两方面:首先,对齐目标不一致,大语言模型往往以担任合格助手为对齐目标,而非扮演“角色”;其次,模型思考能力不足,无法真正代入角色设定。
受多项技术启发,百川智能首创的“思维链对齐技术”,很大程度上缓解了这一痛点。即在模型训练过程中,使用带有思维链的数据构造方式和带有思维链对齐的强化对齐方法,让角色一致性大幅提升。这使得模型基础对话能力和角色演绎能力得到显著增强,也更接近人类。
第二,在数据集的基础之上,AI想要真正塑造一名逼真的游戏角色,不仅需要通过技术手段实现“真实的表演”,还要运用工程手段优化角色构建和部署流程,降低角色定制的综合成本。
在GameLook看来,智能 NPC不仅是塑造逼真互动的工具人,还应推动游戏内复杂故事线的发展。不止局限于对话,AI更有利于创造行动、反应和情感与真实人类无异的角色,后者包括增加角色互动深度的非言语提示和行为。
当前行业内角色构建或复刻主要通过API调用来实现,在实际创作中,往往需要产品、运营、技术等多个部门共同协作、反复调试,开发门槛高、周期长、效率低,最终角色效果还难以保障。
那么,如何获得高自由度及低成本、零代码的定制解决方案?百川智能进一步推出由“角色创建平台+搜索增强知识库”组合而成的开发套件。其通过自研的强多轮对齐、搜索增强知识库两项特色技术,能够有效提高角色定制自由度。
目前百川智能角色创建平台提供30+官创角色,仍在持续扩充
例如,强多轮对齐技术对System Prompt中的角色设定字段进行了精心设计。简单来说,用户在System Prompt中定义什么特征,生成角色就会按用户的设定“表演”出来。
争强好胜、唠唠叨叨、胆小怕事的孙悟空
除了“表演”能力,知识能力是决定AI角色是否“真实”的另一关键因素。具备与其身份相符的知识,才能让角色“表演”不会立刻“出戏”,但这往往具备相当高的开发门槛。
将搜索能力与角色知识能力深度结合后,百川智能针对角色扮演场景优化建库和召回算法,为角色和知识库提供了灵活的“多对多”关联方式。也就是说,开发者通过上传角色所需的知识文档、自定义回复方式即可丰富角色的“内涵”,确保定制自由度的同时大大降低开发难度。
第三,有针对性的同时,AI工具也需满足开发者和不同企业的客制化需求。
AI应该允许开发者快速定义和创造特定于他们项目的角色,赋予开发者和玩家更多控制角色创造和互动的权力。商业化方案上,AI企业也应提供更简洁易用且低成本的解决方案,让AI从大公司的玩具变为真正能造福整个产业的利器。
百川智能的角色创建平台就是一个优秀的示例,创建好角色后,该平台不仅将角色参数微调选项、角色对话效果整合到同一界面,实现“所调即所见”,还通过”零代码“实现“所调即可用”。甚至当角色调试完成后,还可一键将角色代码接入到业务场景完成部署。灵活高效地集成到各个产品开发流程中,创造栩栩如生的智能NPC。
角色调试完成,即可一键部署至业务场景
结语
《西部世界》《失控玩家》等电影中,带有“意识”的NPC与游戏世界相互影响,被视作游戏的终极形态。随着生成式AI和大模型的快速兴起,这个梦想似乎不再遥远。被AI赋予“灵魂”的NPC,正在深刻改变游戏行业。
但目前,囿于技术和资金、人才等限制,这股新风仅仅停留在头部公司中。百川智能角色大模型的出现,有望改变这一现状。其便捷易用、高度可定制等特点,意味着智能NPC不再是大厂角力场,同样也能够惠及全行业和中小开发者。
“百川角色模型+角色创建平台”将推动游戏创作实现更丰富的故事表达、更新颖的互动方式,推动传统叙事体验变革。背后传递出的深层含义,不光有利于更多创意落地,也能加速游戏发展迈入下一个周期。