地铁上,公交车上刷抖音的人太多了,而且男女老少都喜欢刷!抖音上小姐姐的舞蹈,神曲太多太多了。很多歌曲还非常好听,今天我们用Python来爬取网易云音乐中和抖音相关的歌曲,看看这些火爆的音乐是不是也是你喜欢的。
01.数据获取
数据的获取很多时候还是要依靠爬虫的,但是网易作为大厂,反爬功能比较完善,除了会封ip之外还进行了数据加密,一般来说使用requests之类的库直接获取网页源码是得不到想要的数据的。好在高手在民间,有大牛成功的突破了反扒,搞定了这些API,先看一下网易云音乐里面300首抖音神曲:
进群:548377875 即可获取数十套PDF哦!
在网易云音乐的首页搜索“抖音”会返回300首歌曲,其实我们在爬取的过程中会发现抖音相关的歌曲远不止300首,只是网站的显示限制罢了(最终获得了536首歌曲)。
这次我们主要获取歌曲的歌名、ID、歌手、专辑还有评论数,评论数虽然不能完全代表一首歌的受欢迎程度,但是可以在很大程度上反映其火热程度,用来做定性分析足够了。
关于爬虫,在使用了数据接口和现成的加密参数后,已经没什么难度可言,这里我们直接上代码。
其中,CommentCount模块用于返回指定歌曲的评论数,由于是借鉴了别人的代码,这里就不献丑了,需要的朋友可以借鉴这篇文章:(https://www.zhihu.com/question/36081767),最终获得了如下格式的数据:
02.数据可视化分析
现在我们就以这部分数据为基础进行分析,寻找那些受关注度比较高的抖音歌曲。这里用pyecharts 挑选几个纬度进行可视化分析:
1).评论数排名的歌曲
排名的图我们一般柱状图来直观的显示数据的对比关系,柱状图非常清晰的展现排序的关系,一目了然。
-Top10的歌曲
可以看到,排名第一的《说散就散》关注度远高于第二名《再也没有》,而紧随其后的几首歌关注度都在2W+,彼此之间差异不大;虽然我不常刷抖音,但《离人愁》、《纸短情长》等歌曲也非常熟悉,抖音的带火功能可见一斑。
从歌手情况来看,536首歌曲共出自488名歌手,其中1名歌手(春晓萨克斯)贡献了4首歌曲、5名歌手各贡献了3首歌曲、30名歌手各贡献了2首歌曲、452名歌手各贡献1首歌曲,其中多为民间歌手,果然抖音的全民参与程度非 常之高,这也侧面反映出抖音的影响之广泛。
3).歌手的贡献数量-关注度
是不是非常好奇各个歌手的关注度如何,猜猜贡献的歌曲数量越多,受关注度就越高吗,不一定哦!
我们把各歌手贡献的歌曲关注数求和,筛选出排名前30的歌手,发现这30名歌手中只有6名歌手贡献歌曲多于1首。而在关注度排名前10的歌手中只有'The Chainsmokers'一人贡献歌曲超过1首(3首),可见受关注度的高低与歌曲数量并没有太多关联,还是需要以质取胜。
4).专辑-关注度
看看发行的专辑和大家的关注度情况如何,结果让你大吃一惊。
专辑的情况,发现在贡献歌曲数量排名前10的专辑中,只有两个专辑的 综合关注度达到2W以上,这个情况与歌手情况基本一致,这充分说明了要想火还是要提供高质量的作品,依靠数量是不行的。
通过上面的分析我们发现,袁娅维和她的《说散就散》是截至目前抖音歌曲中最火的,当然抖音的歌曲都有一定的时效性,有可能《说散就散》不是当下最火爆的,但却是在一定的时间区间里受关注程度最高的。
03.词云分析
接下来我们不妨分析一下说散就散这首歌的歌词,通过词云图我们发现这首歌是围绕那些纠结的爱情往事展开的,与《前任3》这部电影的主题相互呼应。
作为电影《前任3》的主题曲,除了抖音带火和电影的双重影响外,可能也引起了很多人的共鸣吧,毕竟不管是年轻的小哥哥小姐姐,还是我们这群中年大叔和老阿姨,在过往是岁月中总会留下那么一点点故事吧~
网友评论