厂商稿件

实时语音互动怎么帮助游戏实现社交化?

文/ 呆嫖 2021-08-03 18:27:16

7月30日,由快出海举办的第三届GGCC全球游戏对接会在上海举办。声网Agora社交泛娱乐产品负责人王奇在会上围绕实时互动如何赋能游戏出海与场景创新,进行了分享。

实时互动为游戏提供了更多创新运营玩法

实时语音互动已成为目前多类游戏的基础配置及用户的刚需,在疫情之下,伴随在线娱乐、社交的需求增长,通过与实时语音的深度融合,游戏行业还衍生出了更丰富的玩法和新颖的场景。

比如去年美国饶舌歌手Travis Scott 在《堡垒之夜》上举办的虚拟演唱会就吸引了超千万玩家同时在线观看。美国大火的晚间脱口秀节目《Animal Talking》也是通过实时语音的形式实现嘉宾间的互动。在节目中主持人和嘉宾全部以动森的形象出现,而且是在游戏《集合啦!动物森友会》的世界里进行。

近期 Metaverse 元宇宙概念大火,也是众多游戏厂商探索的新方向。王奇认为 Metaverse 所强调的是用户在虚拟世界里实现深度沉浸体验且与现实世界保持实时同步,而实时音视频技术则可以打破虚拟和现实的边界,帮助用户在虚拟世界中实现低延时、稳定、流畅的实时互动,成为用户的“耳朵、嘴巴和眼睛”。

此外,直播间 Remote-Play 、实时音视频+游戏等玩法也是实时互动与游戏相结合正在探索的创新玩法和方向。直播间 Remote-Play ,即在主播进行游戏时,观众通过云信令操控游戏输入,实现“主播间游戏同玩” ,增强直播间人气。实时音视频+游戏的形式,能够对视频画面进行动作识别,结合互动游戏,应用于家庭游戏、AI 健身、语聊房互动游戏等场景。

实时语音正在为游戏社交化赋能

据腾讯云和伽马数据联合发布的《2020游戏产业趋势报告》,超过90%的游戏用户倾向于在游戏中与其他玩家互动,81.9% 的游戏用户倾向与其他玩家多人组队合作或者竞技对抗。如小队战斗、团队副本、公会、家族等游戏玩法,无一不是为了增强游戏的社交性,进而成为提高游戏粘性和玩家活跃度、留存率的有效方式。

如何提高游戏的社交属性已成为各大游戏厂商游戏策划的重要组成部分。而语音则是游戏用户的主要交流方式,90.6% 用户会通过游戏中的内置语音功能与其他玩家沟通,73.7% 用户在游戏没有内置语音功能的情况下,会通过语音软件与其他玩家沟通。

王奇表示,游戏社交化已成为不可逆的趋势,语音的实时互动性更强,能带给玩家更沉浸的体验,很大程度上增强了游戏的社交属性,也提升了玩家的粘性。玩家体验越好,游戏传播越广,也越有助于游戏提升用户活跃和留存。

在目前流行的多类游戏中,如MOBA、FPS类竞技游戏,休闲、棋牌类游戏,MMORPG类游戏,语音已成为不可或缺的一部分,甚至能够影响战局表现及玩家的游戏体验。但现阶段实时语音功能在游戏中仍未得到全面普及,并且一些具有实时语音功能的游戏还存在一些体验问题,影响游戏内团队协作执行的成功率或其他体验。

321.jpg

声网Agora 社交泛娱乐产品负责人 王奇

在游戏场景中,特别是海外网络较差的地区,用户在语音互动时会遇到高延时的情况,比如战局到达关键时刻,队友讲话后2-3秒才听到。还会遇到声音卡顿、回声、背景噪声等严重干扰用户游戏体验的情况。对出海的游戏开发者来说,东南亚等海外地区用户移动终端种类繁多且性能普遍较差,加入游戏语音包可能会影响游戏流畅性,用户移动设备会出现发热、发烫的情况。针对这些问题,声网的实时游戏语音提供了一些解决方式。

深耕游戏实时语音技术

据了解,声网Agora自建的软件定义实时网SD-RTN™覆盖了200+国家与地区,拥有超低延时、高并发、高可用、高稳定等特性。特别针对东南亚、中东和国内中小城市做网络优化,全球端到端网络优质传输率超过99%,网络延时小于400ms,延时中位数76ms。同时,SD-RTN™ 在网络架构设计上能够应对10倍以上的负荷,具备千万级并发能力,可以应对爆款游戏玩家流量暴增的情况,保证游戏语音服务的高可用和高可靠。

在游戏语音中,高质量的音质会让互动体验更佳。声网自研的Agora SOLO™、NOVA™ 两大语音引擎,支持48kHz采样率的全频带采样,还原声音高保真度,音频MoS分高达4.7,可为用户提供高清流畅音质体验。

针对游戏语音中可能出现的回声、背景噪声,声网自研的3A算法,可以智能适应各类环境,全面消除回声,并提供超一流的双讲表现,可在不损伤语音音质的情况下,有效消除各类噪音。同时声网的 AI 降噪算法将心理声学与深度学习技术相结合,通过特征提取、神经网络以及增益调整对实时音频进行处理抑制噪声,不同于传统信号处理方案,可为实时音视频提供清晰语音环境。

在游戏语音高音质的基础上,声网还能提供丰富的美声音效,目前声网拥有超 30 种实时美声音效,更有多种变声音效,例如萝莉、小男孩、大叔、猪八戒、绿巨人等音效,让用户在游戏中的语音更具趣味性,也为游戏语音场景提供更多新颖玩法。

对于游戏开发者来说,在开发游戏的过程中经常需要接入一些行业主流的游戏引擎,声网的游戏语音解决方案深度兼容 Unity、Cocos、Unreal 等主流游戏引擎,帮助游戏开发者在接入游戏引擎的同时快速接入声网的音视频服务。

此外,声网专为游戏语音提供的SDK包拥有小包体、低功耗的特点,CPU、内存耗能均低于行业20%以上,且已经适配20000多款终端设备,特别适用于东南亚、中东等用户移动设备种类繁多且性能较差的地区。

目前《Mobile Legends: Bang Bang》《Yalla Ludo》《新诛仙》《无尽战舰》《狼人杀》等国内外知名的游戏均采用了声网的实时游戏语音解决方案。

12.jpg

会后,葡萄君也参与了王奇的媒体群访,以下为经过整理的采访实录:

2020年对于游戏内音视频的使用情况,算不算是一个拐点?它从2020年到2021年,整个使用情况有什么具体的变化?

王奇:2020年之前,虽然我们也有游戏的客户,但是游戏客户并没有很强地意识到音视频带给他的价值。只有少数比较成功的游戏很早就关注到,比如《王者荣耀》《泡泡龙》,它们其实一出来就有语音的功能,这正是成功的关键点。大多数企业没有关注到这点。2020年的疫情其实是教育了这些游戏平台们,他们是被动地接受到了这个信息:我在家里出不去,我玩游戏很多时候是想跟朋友一起玩,是想要社交。这样他们就会去开发一些跟社交相关的功能。

因为过往开发游戏,像那种单机时代的游戏,更多是以通关为主。现在的游戏,更多还是强调了一种社交属性在里面。2020年的游戏社交化更加明显之后,整体语音在游戏里面的占比,其实是一个持续增长的过程。

除了MOBA游戏外,在这一两年的发展中,有哪些其他品类的游戏,逐渐提高了对音视频的依赖度?

王奇:比如《我的世界》这种,它其实是没有一些特定任务的,玩家可以随便建一些房屋、场景的。这种游戏为什么能火?背后的逻辑其实就是社交,既然要社交,这些游戏其实都会向我们提出实时语音的功能需求,不管是在一定范围内大家可以相互交流,还是小队之间交流,都是有一个相同的特点,就是实时语音这个功能。

对出海游戏而言,实时语音最大的痛点是哪方面?

王奇:首先是网络的稳定。因为出海,各个地方的网络是不一样的,比如说像菲律宾、越南或者东南亚那些地区,它的网络是不太好的。还有一点就是性能的消耗。东南亚很多国家的智能手机性能较差,稍微CPU占比高一点,手机就完全发烫,根本就玩不了。所以我们当时跟沐瞳做的很多工作是什么呢?优化CPU占用率,优化内存占用率,去更大程度地覆盖东南亚的这些用户群体,我们目前可以做到CPU、内存耗能均低于行业20%以上。

另一个就是各个国家之间要互通。比如东南亚跟美国的玩家也可以互通。这种远距离的传输其实是需要提前去建设节点的,声网现在在200多个国家跟地区都有建点,他们相互之间的通信有保障,而且延迟也非常低。我们目前可以做到,全球端到端网络优质传输率超过99%,网络延时小于 400ms,延时中位数 76ms,这样就能满足他们游戏内音视频的实时互动。

底层技术是什么?

王奇:我们提供的技术,整体来说叫做实时音视频的PaaS服务,这个PaaS服务它由两部分构成,一个是SDK,一个是后台的线路。而这个SDK它其实是一个入口,你进入这个网络的一个入口。如果是游戏,就相当于游戏开发商需要把我们这个SDK,打包到他的游戏里面。当他游戏里面的用户需要语音对话的时候,他会通过一个接口的形式,接入到了声网的全球网络来。比如说现在你跟北京的朋友正在玩moba类手游,而你在上海,上海有我们声网的点,声网的点就会把你的这一段语音数据(传输出去),你说“赶快回家”,“赶快回家”这句话就会从我们上海的服务器传到北京的服务器。游戏开发商只需要把我们软件包放进去。当你点这个游戏内的语音按钮的时,就唤起了我们的SDK。

在游戏领域这一块的应用,以后可能还有哪些待挖掘的和拓宽的场景?

王奇:我觉得最吸引人的还是metaverse元宇宙。虚拟跟现实会越来越结合,最后会几乎没有边界,而我们所有人会有一个现实的身份,还有一个虚拟的身份。虚拟身份相互之间的交互,它其实也是通过语音跟视频去交互的。

一个虚拟的物体,它要在现实世界中去呈现出来,它其实也是通过图像技术去渲染。图像在这边所做的改变,要去传到远端,你在上海操作,你的朋友在北京也能看到这个变化。它其实是通过图像、视频的传输,从上海传到了北京,在你的朋友那边去展现出来、呈现出来。这样的技术,其实跟我们声网也有非常强大的关联。它里面的交互,或者说渲染,这些技术跟游戏厂商的沉淀是有关系的。所以很大概率,未来metaverse真的实现了,它里面的很多技术会是由游戏开发商去提供的,这也是游戏需要关注的一个重点场景。

声网现在好像是有在探索AI算法这一块,能不能具体说一下?

王奇:AI有非常多的细分领域。比如说我们会做一些变声,你玩《王者荣耀》的时候,用孙悟空这个英雄,你的声音也会变成孙悟空的声音,就会更沉浸。再比如说美声功能,我们会去美化声音,美声美颜其实我们都有在做。像我们的虚拟主播,就是通过识别声音,去给主播生成一个虚拟的形象。而这个形象的嘴型、动作,是由主播的声音跟动作去驱动的,这其实也是AI。

声网一直在提的大网优势,主要具体是指哪些优势呢?

王奇:大网优势首先是我们的节点会很多,我们在全球200多个国家都有节点。另外一个是我们网络架构的先进性。假设《堡垒之夜》要来声网上办,2700多万观众同时去观看,网络压力其实是很大的。但是通过全球的协同和合作,全部的节点去做一个分布式的传输,其实是可以做到短时间承受10倍以上的用量暴增,这也是我们很大的一个优势。另外我们在一些弱网的对抗、重传的策略上,其实也有很多年的沉淀跟积累了。

今后声网跟游戏厂商的合作,有没有一些期待或者亮点?

王奇:其实最主要还是我们做一些新方向的探索,我们希望通过一些新的方案跟能力,去给他们提供更多的变现,或者拉新能力。现在主流的游戏直播平台目前的变现其实是比秀场直播要弱一些的。秀场直播里面非常直接,比如说榜一大哥去刷火箭、刷礼物,主播会感谢、会跳舞、你可以点歌,这都是及时反馈的。而去看游戏直播的这些用户,他最主要就是看这个主播打游戏,并没有很强的一个冲动去给主播刷火箭。

我们如果去搞一个多人直播的互动,它其实可以起到什么作用?观众刷礼物要能改变这个直播的内容、这个游戏的内容,改变这个游戏的内容之后,它其实就可以非常大地去提升观众的参与感,他就愿意去刷礼物了。比如,主播快要输了,这个时候我给他疯狂地刷火箭,可以提升他的经济能力或者战斗力。这样粉丝刷礼物的冲动就会非常强,这也是我们去研究的其中一个方向。

是已经在做了吗?

王奇:有这个计划,并且已经有一些雏形在做。

是在已有的游戏里面增加新的模式,还是说?

王奇:不是,肯定都是新做的游戏。它原本的游戏设定,跟你新的直播间游戏是不一样的,肯定都需要特殊定制的。因为你直播间的游戏不仅仅强调的是刷礼物或者说刷弹幕,它强调的其实是观众的互动可以影响游戏的进程,它跟原本所有游戏的设计理念是有非常大不同的,所以这些游戏都要重做。

Alex Matveev
2022-06-06 16:27:13
不合规
审核中
@苏某某: 她在音乐方面的喜好,以及对天文的兴趣,也源于这部动画的影响。一直很喜欢爵士乐的她突然开始想
乐方面的喜好,以及对天文的兴趣,也源于这部动画的影响。一直很喜欢爵士乐的她突然开始想,没有系统了解过此类音乐的她怎么会喜欢上 呢?后来听完《美少女战士》原声带后才发现,“原来我在那么小的时候
评论全部加载完了~