一年多以前,葡萄君报道了一个明星级AI创业团队启元世界。
他们由两位阿里出身的科学家牵头,扎根通用人工智能领域,当时部分游戏大厂很快便看中了启元AI在游戏行业的应用前景,并与之达成了合作。
而过去的一年里,启元世界不仅继续备受资本看好,融到了来自GGV纪源资本、高榕资本等顶级投资机构的3亿资金,还与莉莉丝、阿里等大厂的旗舰游戏产品进行了合作。目前,启元的游戏AI解决方案已经被应用在《万国觉醒》、《三国志战略版》、《Farlight 84》等头部游戏中,此外还打造了卡牌、战棋、FPS等多个品类的标杆案例。
启元世界为游戏厂商提供跨品类的AI整体解决方案
在采访了启元世界两位创始人袁泉和龙海涛之后,葡萄君发现游戏厂商对于AI的运用方式,远远超出了我们原先的设想,甚至深入了游戏数值与生态平衡性设计、体验创新等层面,真正地大范围深层次改变着游戏。
01 用AI怎么做游戏生态与数值平衡设计?
游戏生态健康与数值平衡是几乎所有游戏的必经之路,但要论设计难度,SLG可以说数一数二。
一个健康的SLG生态势必分为大R、中R、小R、NPC四层,资源时刻在这些群体当中流动,相应的数值也会随之动态变化,要形成良性循环,不出现恶性的波动,就需要足够强的数值体系和平衡设计。
过去的数值平衡搭建,靠的是模型设计、反复测试,而这些工作往往都非常考验人的经验,或者依赖于传统大数据算法的积累。
但问题是,如果依靠人的经验,那么必定要让策划付出大量的精力来设计,爆肝熬夜自然少不了,如果是依赖于传统算法,那么随着SLG基本资源体系不断变复杂,要在爆炸式数值组合中找到最优解,对数据积累和算力的要求就会越来越高。
一些技术比较前沿的SLG游戏已经在引入AI辅助设计,比如网易的《率土之滨》、莉莉丝的《万国觉醒》、阿里的《三国志战略版》。其中后两者都用了启元AI的解决方案。
在启元世界仅用了两个月为《万国觉醒》部署的数值设计与优化解决方案中,它的AI便可以更智能高效地挖掘阵容数据,提供最优解。比如在新赛季推出新统帅时,这个统帅卡该如何设计,如何与原先的卡牌搭配,如何避免破坏游戏原有的平衡生态,确保新卡不会淡化玩家的手牌。带来的效果也非常超出预期:“策划看了之后直呼nb。”《万国觉醒》的策划还反馈,称目前新统帅强度预估的使用效果很不错,后续也会继续使用。
只用了两个月,启元世界就为《万国觉醒》上线了AI数值设计与优化解决方案
“过去在没有大规模线上测试之前,策划可能会对设计出来的东西心里没底,也可能上线之后出现了bug阵容要过两三个月才能被发现和解决。但启元AI可以利用有限的算力,在爆炸式组合空间中,在天级别找到最优解。”这套工具的应用,极大程度地释放了策划的生产力并保障了游戏里的生态平衡。
据悉,在另一款SLG游戏中,厂商在投入新武将时,可以凭借启元的AI更有效和准确地判断对当前数值生态的影响、是否存在bug,以更好地规划投放内容,并且避免运营事故。而在某款卡牌游戏里,合作方也在用启元AI来辅助设计新的卡牌,这套设计方案也成了他们的标配。
“在接下来两三年时间里,基于人工智能去做辅助设计,将会成为一个行业标配。策略、卡牌、RPG等数值游戏里,有没有AI帮助产品做辅助设计、去平衡整个生态和数值体系,必定会在产品的数值体系设计上,形成决定性的差距。”
启元世界AI解决方案的合作标杆案例
02 用更聪明拟人的AI增加游戏乐趣
在输出游戏AI解决方案的过程中,启元世界又发现了游戏厂商另一个需求:为SLG游戏和FPS游戏提供具备高认知决策能力的在线智能体。
如果说辅助数值平衡的设计对游戏的影响是降本增效,那么在线智能体,解决的就是游戏冷启动阶段、不活跃期、不平衡期,或者玩家进入垃圾时间、沉静期的时候,如何提供更多乐趣的难题。
启元世界透露,他们花三个月为某款SLG战棋游戏研发的AI托管功能,战斗效果比行为树托管系统高出一两倍,打得更聪明、战损比更低,甚至能和资深策划打得不相上下。合作方表示,启元的开发提高了游戏的AI战斗水平,增加了托管战斗的易用性,解放玩家更多的操作和精力,也对启元在合作中响应速度称赞有加。
在线智能体也是如今FPS游戏厂商对启元AI的一大需求,厂商希望启元实现的是行为表现更加拟人、战斗水平更加智能的AI。
比如在莉莉丝的FPS游戏《Farlight 84》中,启元的在线智能体能在3D大地图上完成自由上下楼梯、搜物资、听声辨位、交战、跑毒、多人配合等操作,然后还能索敌、绕后、找掩体、射击、移动身法、补状态等,同时还需要能应对FPS对抗的突发性和变数,以及玩家可用的主动技能,大地图上还包含了多种独特载具、背包等,这些都要让AI学会。
“FPS里人类高手玩得很花,突发情况也更多,用行为树写死都写不出来”,启元世界坦言,这对比SLG、MOBA、RTS有它独特的难点:“由于AI的学习环境从平面转变成了3D场景,所以我们无法用过去基于语义数据、2D平面算法进行智能学习的方式,而是要用类似智能驾驶的手法,用更高的认知能力去感知环境。”
事实上,战术竞技高端玩家的强大不仅仅在于射击技术,更在于对地图的理解、对其他玩家行动和心理的预判、对行动时机的判断和执行力、对战场信息的精确捕捉等多个方面。对于AI来说,比起枪法,这些策略更难学。
在一天数百万局对战的训练之下,如今的启元AI不光基本操作在线,占点、身法和走位的技术也颇为惊人。《Farlight 84》的策划透露,启元的深度强化学习AI应用到项目中以来,实现了跑毒、搜索、战斗三个部分的功能,不仅搜索时的转身、后退、跳跃、喷气等动作让人颇感惊喜,跑毒时还可以与战斗、搜索等行为相互转换,此外交战时动作丰富,多种战斗策略交替实施,甚至能给玩家展示新的战斗思路。
一个小插曲是,AI还会利用地图bug对战、穿墙抢物资,变相帮助莉莉丝项目组抓了不少虫。
能看到,对比前文提到的深度挖掘,在线智能体乍看之下就像早年打《星际争霸》的启元AI,但与《星际争霸》的根本不同在于:“过去AI要赢得漂亮,现在要做的则是怎么通过更聪明拟人的AI让游戏有更多乐趣。”
03 “用一套算法适配多款游戏”——通用人工智能开始落地
启元世界之所以能在帮助多个游戏平衡数值设计,原因在于它专注的通用人工智能,具备极高的学习能力,以及迁移泛化的能力。
“在庞大的、组合爆炸式的空间内的搜索最优解,AlphaGo、AlphaStar等AI已经证明比传统算法要好很多了。”但在应用层面,还有一个难题。
“如果要面对SLG这样有若干地图、几百个武将和战法的游戏,需要探索的问题空间更大,如果不把算法和工程优化到极致,就无法落地。”启元世界把智能算法分为四个层级:
第一层L1,一套算法会玩一款游戏,如同启元世界早期研发的打败《星际争霸》职业冠军的AI。
第二层L2,一套算法适配多款游戏,现在启元世界就能完整实现L2层级,即基于星际设计出来的大规模神经网络,扩展到SLG、战棋、卡牌、MOBA、FPS等其他领域,几乎有80%的算法可以复用。
第三层L3,一套算法模型可以玩所有游戏。
第四层L4,一套算法不仅能玩所有游戏,还能陪玩家聊天,具备多模态多任务的能力。
启元表示,其正在L2通往L3级别的道路上,凭借深度学习、强化学习能力的增强,它可以持续在有限的时间和算力之内提供最优解决方案,继而为客户降低策划成本、缩短策划周期、提升用户体验。
启元希望用跨品类的AI整体解决方案,
以更小成本、更短周期辅助做好游戏设计和优化
为了达到目前的水平,启元世界从2017年开始积累,在工程算法上积累了大量自研经验,一方面之前花了3、4年时间研究决策模型,另一方面开发了认知大模型,以解决认知推理、知识表达、语言对话的问题。此外,启元还十分重视基础设施搭建,通过算法定义硬件和不断优化系统引擎,在高效数据吞吐、网络训练、推理引擎优化等方面积累了上千个技巧,让算法参数达到了较高的水平,建立起了技术壁垒。“我们所有的技术研发都是偏场景驱动的,选择的则是和互动体验强相关的场景。其实AI的通用化做得越好,它就可以成本越低、接入越快。而想要落地、想要更好地服务客户,就是要降低成本、提高效率。”随着通用能力的不断增强,启元世界发现其AI算法的效率和效果也越来越好,从而能够更快帮助客户用更小的成本、更短的周期做好游戏设计和优化。
“我们发现,基于神经网络的模型参数容量达到一定程度,当你给它灌输各种各样的任务和数据以后,它会有一个互相学习和相互促进增长的过程,比单个的专用模型学得更快。因为它已经学到了很多知识和方法,这也是为什么类似Google这样的公司,现在都在做大模型。”
如今,启元世界的AI解决方案落地方向主要是策略类、动作射击类、卡牌类等游戏。此前深钻大地图FPS,也有为开放世界做铺垫的意图。
在启元看来,开放世界NPC是通用人工智能未来在互动娱乐领域最有想象力的一个应用场景。“不少3A游戏、大制作产品,背后还是堆了海量代码和规则,玩家跟NPC互动多几次,就会发现他的行为逻辑还是比较重复、套路,会觉得这个体验不够沉浸。”
启元世界正在探索如何在游戏内提高NPC的情商和对话交互能力。“我们现在已经可以在自研平台上建立近千亿参数大模型,也能够把成本降下来。如果在一个开放世界的环境里,认知智能和深度决策能结合到一起,就可以帮助游戏创造出更大的乐趣。”
回想二三十年前,大家做游戏的时候,手里没有大数据、也没有智能工具,只能用行为树去编写。如今通用智能AI的出现,已经深入改变了不少头部游戏产品的设计方法,把庞大繁杂的工作交给AI,从而把精力集中到创意之上。
或许在不久的将来,如启元世界的判断那样,AI辅助游戏创作真的将成为行业标配。