美文网首页嵌牛IT观察
差评近一半,用 Python 分析胡歌的《猎场》到底值不值得看?

差评近一半,用 Python 分析胡歌的《猎场》到底值不值得看?

作者: PIN码 | 来源:发表于2017-11-21 21:11 被阅读0次

    朱海鹏

    转载于:http://blog.csdn.net/csdnnews/article/details/78591437  作者 | 布道

    【嵌牛导读】:11 月 6 日,湖南卫视已经开播被称作年度压轴的大戏“猎场”,迅速占领各大榜单,成为一部高热度的电视剧。但是在豆瓣上却形成了两极分化。截止11 月 8 日,该剧在豆瓣上的评分为 5.7 分。相比较胡歌之前《琅琊榜》的 9.1,《伪装者》的 8.3等来说,这一评分确实不高。有趣的是,首页的评分比例与“短评”、“剧评”的比例存在非常大的差异!首页总评分评分两级分化严重,“1 星”占比最高为 28.6%,其次为“5 星”的25.4%。“好评”(5 星、4 星)占比为 35.80%,“一般”(3 星)为 16.50%,“差评”(2 星、1 星)占比为47.80%。很明显,“差评”占了接近一半的比例。

    《猎场》豆瓣评分占比分布

        首页的豆瓣评分中 " 差评 " 占比很高,但是在豆瓣的短评和剧评中却是另一番景象。 在目前 5979 条短评中,"好评 " 占比 71%," 一般 " 为 5%," 差评 " 占比 24%。而在 392 条剧评中,"5 星 " 占了非常高的比例!84.7%的剧评给了 " 好评 "。

    《猎场》剧评评分分布

        我们将三个位置的评分放在一起比较就会出现非常明显的差异。根据这个差异,我们可以大致判断:写出短评或者剧评的观众大部分给予了 " 好评",但仍有大量观众直接给了差评,并没有说明任何原因。

    【嵌牛鼻子】:猎场、豆瓣评分、Python、数据分析

    【嵌牛提问】:《猎场》到底好不好看?我们还是想通过以 11 月 8 日为界,看看人们短评人的情绪,是积极,还是消息。利用词云看看大家都说了什么,希望能大家就是否建议观看给出建议。

    【嵌牛正文】:

    一、爬取《猎场》热门短评,豆瓣的爬虫做的比较好,不登录爬虫很快就会被屏蔽掉,登录后获取 cookies 如下:


    同时建议在循环抓取的时候进行 sleep,例如:

    time.sleep ( 1 + float ( random.randint ( 1, 100 ) )  / 20 )

    《猎场》热门短评内容和时间爬取了 22440 条评论。

    二、对数据进行清洗:

    import pandas as pd

    import matplotlib.pyplot as plt

    date_name=['date','comment']

    df = pd.read_csv('./comment.csv',header=None,names=date_name,encoding='gbk')

    df['date'] = pd.to_datetime(df['date'])

    样本数量:

    三、情感分析和词云

        对热门短评基于原有 SnowNLP 进行积极和消极情感分类,读取每段评论并依次进行情感值分析(代码:https://zhuanlan.zhihu.com/p/30107203),最后会计算出来一个 0-1 之间的值。

        当值大于 0.5 时代表句子的情感极性偏向积极,当分值小于 0.5 时,情感极性偏向消极,当然越偏向两边,情绪越偏激。

    2017-11-06 – 2017-11-08 分析:

    从上图情感分析(代码:https://zhuanlan.zhihu.com/p/30107203)来看,影评者还是还是非常积极的,对《猎场》的期望很高。

    从词云(代码:https://zhuanlan.zhihu.com/p/30107203)上来看,出现好看、剧情、期待、喜欢等词。

    抛开豆瓣的推荐分数,通过的热门短评的情感和词云分析,《猎场》是一部不错的现实剧,有兴趣可以一看。

    相关文章

      网友评论

        本文标题:差评近一半,用 Python 分析胡歌的《猎场》到底值不值得看?

        本文链接:https://www.haomeiwen.com/subject/fkxgvxtx.html