看人家怎么踩坑的啦!游戏运营的装逼技巧の不敲代码!爬文本数据和词云分析

文/ 小桂子 2018-01-09 15:22:55

大家好,我是桂子。 

今天想和大家分享的内容可能并不是游戏产品运营中常规的工作,甚至说很多小伙伴基本不会用到。之所以码出来,那个,一是最近较忙,基础工作知识点的梳理有点慢,二是最近刚好在用着我接下来要讲的内容:文本数据爬取和词云分析,其实就是两个工具的介绍,具体的分析要回归到业务上,所以也较简单基础仅供兴趣了解。

(PS:本文仅供学习了解,不存在任何商业利益目的,作为小运营不敢在大佬们面前造次)

1、业务背景

好,言归正传。先说两个业务情况,方便大家了解工具的使用背景:

1)作为游戏产品运营,有时我们会需要做竞品分析,而竞品分析中有一个步骤就是去了解玩家对竞品的看法,从玩家的评论中了解竞品好的地方和被吐槽的地方,往往人家做得不好的地方就是我们产品获取竞争优势可以试着切入的点

2)为了调优产品,有时运营会有针对地做用户问卷调查,其中一般会有个开放性的问题,就是玩家对游戏的建议或吐槽,我们需要从几百上千份的反馈中挖掘出玩家关心的主要内容,为产品的优化提供参考建议

2、实操内容

而近期,我刚好想针对手头的一款游戏《天天篮球》(容我在这里打个广告,目前游戏还在taptap预约,有兴趣地亲去点个预约咧,感谢感谢)做竞品分析,其中我选中了心动出品的《青春篮球》(毕竟人家做得好嘛,希望举这个例子不会被taptap的大佬们dashi)。

image001.jpg

分析的其中一个思路就是想从《青春篮球》在taptap上3700多条的评论中了解下玩家的看法,特别是一些槽点,我用到了两个工具,完全不需要敲代码的,注册帐号后可以免费使用很多功能:

image002.jpg

1)用于数据爬取的“造数”

image003.png

2)用于词云分析的BlueMC

image005.png

3、评论数据爬取

1、首先我们了解下taptap上游戏《青春篮球》评论页面的链接和不同页面的规律

image007.jpg

通过选择不同评分和不同页面,我们可以发现这个链接的规律是score表示评分,page表示页数,而且也只有这两个参数在变化

明确规律之后,我们就可以通过“造数”来爬取数据了,参照“造数”的使用说明,我们分别确定好1、2、3星评分的页数,然后进行批量爬取,如下:

image009.png

我这里其实省略了很多过程的内容,主要是“造数”的基础使用,这里大家可以自己试着体验下,很快能掌握。开始爬取后就是等待了,页面不会太多,很快就能完成

image011.png

爬取后我们可以得到一个表单,我这里是做过简单处理,保留了文本和链接,链接可以方便我做筛选区分不同星级的评分

image013.png

4、词云分析

词云的生成就更简单的了,注册好BlueMC后,可以在主页看到“词云工具”,点击进入后即可创建任务,把爬取到的文本数据上传,表头要去掉,等待片刻便能完成分析

image015.png

生成后可以看到这样一个词云内容,这里你可以进行二次的筛选处理,把一些对问题呈现无关紧要的剔除,像是这里“游戏”,这样可以更好的突出玩家反馈内容的核心

image017.png

同时,BlueMc提供了原始文本的显示,比如我点击“三分”,可以在词云图下方看到对应的原始文本内容,方便大家具体了解这个高频词反应出的玩家所关心的内容

image019.png

然后,针对词云的分析,不能说停留在表明,还需要进一步去梳理和挖掘,比如再把1、2、3星的评论分开做词云,对比看下不同星级的评论的核心是否有差异等。词云工具只能帮你看到问题可能集中的点在哪里,而如何提炼出有效的结论,更大程度上是需要结合你的业务经验以及合适的数据分析思路来做进一步研究的,而往往思路才是我们最缺乏的。

好了,今天的分享就到此,有兴趣的亲欢迎多尝试一块讨论,当然如果你是python大佬,就不要笑话我这种雕虫小技了哈。最后,大家有兴趣的话去taptap预约下《天天篮球》表示下支持呐,感谢咯~

Alex Matveev
2022-06-06 16:27:13
不合规
审核中
@苏某某: 她在音乐方面的喜好,以及对天文的兴趣,也源于这部动画的影响。一直很喜欢爵士乐的她突然开始想
乐方面的喜好,以及对天文的兴趣,也源于这部动画的影响。一直很喜欢爵士乐的她突然开始想,没有系统了解过此类音乐的她怎么会喜欢上 呢?后来听完《美少女战士》原声带后才发现,“原来我在那么小的时候
评论全部加载完了~