OpenAI创始人：游戏推动了ChatGPT的诞生

近日，英伟达GTC线上大会发起了一场特别活动——英伟达CEO黄仁勋与OpenAI联合创始人兼首席科学家Ilya Sutskever进行了一次“炉边谈话”。两人就OpenAI旗下产品ChatGPT系列，以及OpenAI公司本身的发展进行了回顾和探讨。

Ilya在谈话中提到，在OpenAI及其产品的发展历程中，有2个好点子功不可没——第一个是，通过压缩训练数据让AI进行“无监督学习”；第二个是，让AI进行强化学习。在介绍强化学习部分时，Ilya特地提到了《DOTA2》——训练出能与职业选手对抗的《DOTA2》AI，这是他们在OpenAI中完成的第一个真正的大型项目。

在2017年的《DOTA2》国际邀请赛（TI7）上，OpenAI首次与《DOTA2》玩家见面。当时的OpenAI还无法进行5V5对战，只可进行中路单挑。在表演赛环节，主办方请来了TI1冠军队选手Dendi，他使用英雄影魔与OpenAI进行中路单挑。OpenAI展现了熟练的卡兵技巧，随后仅用4分40秒就2:0击败了Dendi。

比赛期间，OpenAI官方在YouTube上发布视频，解释了为何团队选择用《DOTA2》来训练AI——《DOTA2》机制较为复杂且竞技性较强，AI在游玩中需要不断学习新的技能、新的玩法，才能达到和职业玩家相当的水平，这使《DOTA2》成为了很好的AI自我训练道具。

在此之后，OpenAI研发出了《DOTA2》5V5对战AI——OpenAI Five。5V5对AI之间的合作、策略规划提出了更高要求。在实际对战中，OpenAI Five的合作表现确实不如职业选手——2018年8月TI8，职业战队paiN在表演赛上对战OpenAI Five，最终取胜；在TI8的第二场表演赛上，BurNing徐志雷、骆非池iG_430等5位国内前职业选手组成小队，对战OpenAI Five，也同样取胜。

OpenAI Five在2018年的战绩并不好看，但它的成长速度超出了许多玩家的想象——2019年4月，OpenAI Five与TI8冠军战队OG进行BO3对战，官方对这次比赛进行了直播。

最终OpenAI Five以2:0的比分拿下了BO3胜利。期间还多次表演了诱敌深入、丝血逃命的“骚操作”。

比赛之后，OpenAI官方宣布在2019年4月18-21日举办Open Five擂台赛，期间全球玩家可自行组队挑战OpenAI Five。根据官方最终在推特上公布的数据来看，OpenAI赢得了7215场比赛，输掉了42场，胜率高达99.4%。

谈到OpenAI在《DOTA2》上的尝试，黄仁勋表示，当时OpenAI看似在走弯路，但现在回顾却发现正是这些弯路导致了ChatGPT的产生。Ilya表示认同——从某一方面来说，通过《DOTA2》，OpenAI的学习模式从“强化学习”转变为了“基于人类反馈的强化学习（RLHF）”，这为后来的ChatGPT技术提供了借鉴。

当然，《DOTA2》只是OpenAI的突破性尝试之一：在早期同行专注于神经网络的深度时，OpenAI已经在兼顾考虑神经网络的规模；团队曾运用英伟达GPU和ImageNet来训练神经网络模型，而用黄仁勋的话来说，其训练结果“震惊了世界”。

据llya介绍，今年3月推出的GPT-4采用多模态模型，不仅能够更好地理解文本，也能从图像中获取和学习信息，GPT-4也因此具有更强的总结推断能力。但llya也坦言——OpenAI还没有充分挖掘出AI的潜力，AI领域在未来还会持续进步。

回顾过去，《DOAT2》并不是唯一一个推动科技及研发进展的游戏。最被玩家熟知的，可能还是2005年的“堕落之血事件”——因为暴雪设计上的疏漏，一种传染性极强的debuff在《魔兽世界》各大主城传播，造成大量玩家角色伤亡。“堕落之血事件”一度得到了公共卫生学界的关注，很多研究者将“堕落之血事件”作为流行病学的“虚拟案例”加以研究，还有人撰写了相关论文并刊发在医学期刊《柳叶刀·传染病》上。

图源YouTube@Half as Interesting

除了这些成果较为明显的案例，游戏行业的发展本身就对科技有着不小的推进作用。今年2月，新华社旗下的每日电讯发文《别忽视游戏行业的科技价值》表示，游戏科技近年来正在芯片、终端、工业、建筑等实体产业领域实现价值外溢，释放更多效能。

此外，文章认为，游戏产业汇聚了大量高水平科技人才，并且其发展顺应消费者需求，兼具市场与人才的“先天优势”，将为更多科技创新提供基础环境。

OpenAI创始人：游戏推动了ChatGPT的诞生

相关文章