用python对鹿晗微博进行数据分析

用python对鹿晗微博进行数据分析

作者: matianhe | 来源:发表于2017-08-27 22:23 被阅读0次

用python对鹿晗微博进行数据分析
鹿晗和关晓彤恋爱公开，原来鹿晗是萝莉控，只是这萝莉有点……
鹿晗公布恋情：真爱你的人，会让全世界都知道
鹿晗关晓彤：爱你就是要让全世界都知道呀！
效应之鹿晗效应
大家好，给大家介绍一下，刚刚就是鹿晗和关晓彤，把微博整瘫了~
娱乐圈又成一对？鹿关恋情曝光
鹿晗表白用的这个符号，在古代很贵哦
不忘初心，坚信自己
无标题文章

转载请注明地址：用python对鹿晗微博进行数据分析
这篇文章主要对数据进行简单的分析，代码在这里：
python利用pandas、matplotlib和wordcloud做数据分析

准备分析的数据：
|----评论者的微博昵称
|----微博的评论
|----评论者的性别
|----评论者的所在地
|----评论者的生日

这次的数据准备了30万+评论，其中不重复用户14万+。数据只是简单的进行了简单的去重和缺失值处理，感觉不用特别精确也能看出结果。这次的分析不是最终的结果，只是可以参考的一个趋势

用户分析

首先来看看评论最多的前几名
我的天，一个人一条微博评论800+，这是不用吃饭吗。。。
不知道前三十里面是不是全是真爱啊！

再来看看评论数的折线图
感觉在平稳的折线取值分析比较靠谱，所以放大了看看。
14万数据，出现一人几百条的也就那几个，所以把他们筛选掉。
在1000左右，人均的评论数差不多在20左右，才感觉不会是刷出来的。

再看看性别，毫无疑问的。
感觉这个结果还算正常，比计算机专业男女比大一点。

之后再来说年龄分布
由于微博默认生日的原因，有好几个突出点，可以忽略，我也把范围截取到了1949年-2017年。
90后的峰值我预料到了，但是没想到00后会降的这么明显。难道真的都喜欢TF？本来想在爬一下TF的看看，不过感觉大同小异就没有再做。
之后看看具体排名吧：
第一是98年的同学，不过前几名差距不是很大，可能跟采集的数据有关系。
可以看出来00后只有 00、01、02在坚守阵地了。
90后真的老了吗。。。。。

最后来看看地区分析吧
先来看看省份和四个直辖市分布，北京第一，有一点可能好多人都改成了和鹿晗一样的东城区。。。所以可能不是很准确。
其次是广东，不知道为什么，好多刷量小号默认位置也是广东，不知是不是这个原因和北京并列。
河北排在了第9。。。

再来看看城市分布

海淀区居然是第一，这个没有想到。
基本上分三个梯队吧，石家庄在第三梯队。
很尴尬的是，分词的时候把大连给分了？

最后看看整体城市分布比例吧，感觉石家庄有点小啊。

评论分析

从词云上可以看出来，评论中出现最多的词是鹿晗，这点并不意外。
其次，音乐，爱，零界点，棒棒糖等词也排在前面，我想是因为这次爬取得微博是棒棒糖那篇。
另外中间右部，迪丽也出现了，可能八卦的网友也不少啊。
整体感觉比较正能量，黑粉还是要少的多。

整体分析差不多就这样了，第一个项目做的有点慢，下次计划分析一下淘宝的商品信息，不过爬数据要花时间，可能会很久了。

相关文章

用python对鹿晗微博进行数据分析
转载请注明地址：用python对鹿晗微博进行数据分析这篇文章主要对数据进行简单的分析，代码在这里：pyth...
鹿晗和关晓彤恋爱公开，原来鹿晗是萝莉控，只是这萝莉有点……
鹿晗和关晓彤恋爱了，我的心里没有丝毫波动。但是对鹿晗的粉丝打击太大了，鹿晗的微博都炸了，就差组团抢人了，表...
鹿晗公布恋情：真爱你的人，会让全世界都知道
今天（2017年10月8日12:00），鹿晗在微博公开与关晓彤的恋情，而后鹿晗工作室对媒体称恋情属实。鹿晗作为小...
鹿晗关晓彤：爱你就是要让全世界都知道呀！
1 今天微博炸了，是真的炸了，鹿晗关晓彤公布恋情半小时后，微博瘫痪了。可见鹿晗的粉丝量和影响力是有多大。有关鹿晗...
效应之鹿晗效应
2014年1月12日，EXO人气成员鹿晗更换微博头像，顿时引爆粉丝狂潮。不到一个小时，有关鹿晗更换微博头像的微博...
大家好，给大家介绍一下，刚刚就是鹿晗和关晓彤，把微博整瘫了~
今天在刷微博时，猝不及防地被撒了一把狗粮是的！！鹿晗超高度疑似发微博公开了和关晓彤的恋情！！！随后陈赫对鹿晗...
娱乐圈又成一对？鹿关恋情曝光
每日热门事件鹿晗公布与关晓彤恋爱近日当红小鲜瘦偶像鹿晗微博公开与女星关晓彤恋情鹿晗发博：大家好，给大家...
鹿晗表白用的这个符号，在古代很贵哦
近日，鹿晗在微博表白“国民闺女”关晓彤，几句话就让微博瘫痪。不管是鹿粉还是吃瓜群众，肯定想不到鹿晗表白用的@符...
不忘初心，坚信自己
我知道很多少人因为鹿晗一句话（图一），导致很多人脱离了鹿晗粉丝群或，鹿晗贴吧及鹿晗微博话题，甚至屏蔽了所有关于鹿晗...
无标题文章
鹿晗表白，微博瘫痪 | 为什么中国人就是爱娘炮？图 | 网络昨天新浪微博宕机长达一小时，原因是鹿晗发了一条微博...

网友评论

本文标题：用python对鹿晗微博进行数据分析

本文链接：https://www.haomeiwen.com/subject/uziidxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|用python对鹿晗微博进行数据分析|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！