近日,英伟达GTC线上大会发起了一场特别活动——英伟达CEO黄仁勋与OpenAI联合创始人兼首席科学家Ilya Sutskever进行了一次“炉边谈话”。两人就OpenAI旗下产品ChatGPT系列,以及OpenAI公司本身的发展进行了回顾和探讨。
Ilya在谈话中提到,在OpenAI及其产品的发展历程中,有2个好点子功不可没——第一个是,通过压缩训练数据让AI进行“无监督学习”;第二个是,让AI进行强化学习。在介绍强化学习部分时,Ilya特地提到了《DOTA2》——训练出能与职业选手对抗的《DOTA2》AI,这是他们在OpenAI中完成的第一个真正的大型项目。
在2017年的《DOTA2》国际邀请赛(TI7)上,OpenAI首次与《DOTA2》玩家见面。当时的OpenAI还无法进行5V5对战,只可进行中路单挑。在表演赛环节,主办方请来了TI1冠军队选手Dendi,他使用英雄影魔与OpenAI进行中路单挑。OpenAI展现了熟练的卡兵技巧,随后仅用4分40秒就2:0击败了Dendi。
比赛期间,OpenAI官方在YouTube上发布视频,解释了为何团队选择用《DOTA2》来训练AI——《DOTA2》机制较为复杂且竞技性较强,AI在游玩中需要不断学习新的技能、新的玩法,才能达到和职业玩家相当的水平,这使《DOTA2》成为了很好的AI自我训练道具。
在此之后,OpenAI研发出了《DOTA2》5V5对战AI——OpenAI Five。5V5对AI之间的合作、策略规划提出了更高要求。在实际对战中,OpenAI Five的合作表现确实不如职业选手——2018年8月TI8,职业战队paiN在表演赛上对战OpenAI Five,最终取胜;在TI8的第二场表演赛上,BurNing徐志雷、骆非池iG_430等5位国内前职业选手组成小队,对战OpenAI Five,也同样取胜。
OpenAI Five在2018年的战绩并不好看,但它的成长速度超出了许多玩家的想象——2019年4月,OpenAI Five与TI8冠军战队OG进行BO3对战,官方对这次比赛进行了直播。
最终OpenAI Five以2:0的比分拿下了BO3胜利。期间还多次表演了诱敌深入、丝血逃命的“骚操作”。
比赛之后,OpenAI官方宣布在2019年4月18-21日举办Open Five擂台赛,期间全球玩家可自行组队挑战OpenAI Five。根据官方最终在推特上公布的数据来看,OpenAI赢得了7215场比赛,输掉了42场,胜率高达99.4%。
谈到OpenAI在《DOTA2》上的尝试,黄仁勋表示,当时OpenAI看似在走弯路,但现在回顾却发现正是这些弯路导致了ChatGPT的产生。Ilya表示认同——从某一方面来说,通过《DOTA2》,OpenAI的学习模式从“强化学习”转变为了“基于人类反馈的强化学习(RLHF)”,这为后来的ChatGPT技术提供了借鉴。
当然,《DOTA2》只是OpenAI的突破性尝试之一:在早期同行专注于神经网络的深度时,OpenAI已经在兼顾考虑神经网络的规模;团队曾运用英伟达GPU和ImageNet来训练神经网络模型,而用黄仁勋的话来说,其训练结果“震惊了世界”。据llya介绍,今年3月推出的GPT-4采用多模态模型,不仅能够更好地理解文本,也能从图像中获取和学习信息,GPT-4也因此具有更强的总结推断能力。但llya也坦言——OpenAI还没有充分挖掘出AI的潜力,AI领域在未来还会持续进步。
回顾过去,《DOAT2》并不是唯一一个推动科技及研发进展的游戏。最被玩家熟知的,可能还是2005年的“堕落之血事件”——因为暴雪设计上的疏漏,一种传染性极强的debuff在《魔兽世界》各大主城传播,造成大量玩家角色伤亡。“堕落之血事件”一度得到了公共卫生学界的关注,很多研究者将“堕落之血事件”作为流行病学的“虚拟案例”加以研究,还有人撰写了相关论文并刊发在医学期刊《柳叶刀·传染病》上。图源YouTube@Half as Interesting
除了这些成果较为明显的案例,游戏行业的发展本身就对科技有着不小的推进作用。今年2月,新华社旗下的每日电讯发文《别忽视游戏行业的科技价值》表示,游戏科技近年来正在芯片、终端、工业、建筑等实体产业领域实现价值外溢,释放更多效能。
此外,文章认为,游戏产业汇聚了大量高水平科技人才,并且其发展顺应消费者需求,兼具市场与人才的“先天优势”,将为更多科技创新提供基础环境。