美文网首页Python数据分析
数据分析之《我不是药神》

数据分析之《我不是药神》

作者: NGUWQ | 来源:发表于2018-08-16 12:22 被阅读0次

    前言

    作为暑期最受欢迎的电影之一,《我不是药神》在上映之前就被刷屏,它不仅是豆瓣16年来第9部评分超过9.0的华语影片,也是第5部票房超过20亿的影片。记得小编当时还在学校未放假时,药神就在朋友圈被好友频频安利,于是一放假就迫不及待的去看了。看完给我的感觉就是中国这样的电影真的太少了,毫无疑问,它的成功是必然的。于是在其上映一个月后,小编想看看全国网友对药神的评价究竟如何,就做了关于药神的影评分析。

    数据抓取

    此次数据爬取我们参考了之前其他文章中对于猫眼数据的爬取方法,调用其接口,每次取出1000页的数据并进行去重,为了使最终的数据可靠性更高,小编抓取了多次当日的数据,代码如下:

    数据分析

    我们先来看下所得到的数据

    这个数据是小编去重后所得的,并且按照了城市进行排序,后面的部分主要围绕评分、城市、评论展开。

    首先看一下评分热力图

    京津翼、江浙沪、珠三角等在各种榜单长期霸榜单的区域,在热力图中,依然占据着重要地位。同时,我们看到东三省和四川、重庆所在区域也有着十分高的热度,这表明药神的热度即使到现在也还是特别高的。

    下面我们要看的是主要城市的评论数量与打分情况

    打出最高分4.86的城市是无锡市,而最低分4.46是东莞市,而徐峥的家乡上海打分在4.6左右。综合各个城市的打分来看药神的评分还是比较高的。

    我们按照打分从高到底对城市进行排序

    在评论数量最多的二十个城市中,评论数量最高的是深圳,北京,其次是成都。而后15名的评论数量和评分都差不多。说明药神的口碑没有出现两极分化的现象。这也跟药神一直以来的评价所对应。

    我们把城市打分情况投射到地图中:(红色表示打分较高,蓝色表示较低)

    可以看出南北方对这部电影的评价都很高。这也是药神的票房之高的原因。

    看过了评分,我们看一下评论生成的词云图,以下分别是原图和据此绘制的词云图

    从生成的词云中可看出网友对药神的评价最多的是好看,现实,感人,真实,良心。这与小编在朋友圈中看好友所发的对药神的评价都是一致的。正如战狼2一样,把钱花在制作上,用心拍摄的良心大作,相信还是会有回报,国产电影是可以兼顾社会责任和商业利润的!用心做电影,时代不会辜负你,观众不会辜负你!正如一些网友评论所说,这是中国电影人的良知觉醒,应该多些现实题材的呼吁,反映民众的心声,告诉政府和社会我们需要做什么。

    部分代码展示

    热力图

    折线图+柱形图组合

    词云

    本篇代码:

    https://github.com/NGUWQ/yaoshen

    对爬虫,数据分析,算法感兴趣的朋友们,可以加微信公众号 TWcoding,我们一起玩转Python。

    If it works for you.Please,star.

    自助者,天助之

    相关文章

      网友评论

        本文标题:数据分析之《我不是药神》

        本文链接:https://www.haomeiwen.com/subject/iainbftx.html