自古文人皆孱弱,看林夕,果然才多身子弱。一人扛鼎中国流行乐词坛半壁江山,横扫几个时代的大金曲。不论北京奥运,还是上海世博;不论是四十大天王,还是五十大天后,都为林夕叫绝。当真是三头六臂,七步成章,八斗之才,九曲断肠,以一当十。轻易斩获奖项数百。三十多年写情感,讲道理,无人能出其右;他写绝了绝望;且下手果决,毫不留情,直杀人心。
林夕一直是我非常喜欢的一位词人,所以今天就是要对林夕写的词,做一次数据分析。数据来源自虾米网站,根据林夕为关键字,一共搜到了2693首歌。
image.png
数据抓取比较简单,直接写了一个requests,把这两千多首歌的信息抓取了出来,其中主要字段包括歌名、艺人、所属专辑以及歌词的链接,在通过请求歌词的链接,抓出了所有歌的歌词信息。
使用jieba的搜索模式,对所抓取的歌词进行了分词处理,下面是高频词的统计。
通过自然语言处理对这些高频词进行情绪分析,得到结果如下:
image.png这个结果,一点不奇怪。因为林夕就喜欢写那些爱而得不到,失而不复得的虐心故事,这要是能正面才怪了。
林夕都给哪些歌手写过歌,我们也来分析一下:
image.png
前三名毫无意外,陈奕迅、王菲、杨千桦。
林夕也曾公开说过,他把自己感情的际遇、故事都写给杨千嬅,这些东西被他自己总结提炼成智慧的时候就由王菲来唱,其中的道理让陈奕迅诠释,最后无法诠释的凄美都写给了黄耀明。
由于我所抓取的2693首歌曲里,并没有做去重处理。也就是说,有很多live版的,或者是被其他艺人翻唱的,所以这个统计并不是最精确的,只是做下参考。当然,没去重也有没去重的好处,我们可以分析一下,那些歌演唱、或被翻唱的次数比较多。
对于"约定"这首歌竟然没有上榜,我还是挺意外的!
让我们在对关键词进行一次权重分析,这样应该可以更加直观的看出林夕所写的词所要凸显的主题。
我相信看到这里,即使不用情绪分析,光看这些关键词,都能看出林夕写的爱情都是凄美、悲伤的。
再来看看高频词的词性,都有哪些:
到这里会发现一些很有趣的内容,就是林夕写词很少用主语,这也增加了歌词的魅力。因为没有主语,所以每个人在唱、或者听的时候,才能有感同身受的感觉。
我们在来分析一下,林夕到底是向前看,还是向后看:
从数据分析来看,活在当下是林夕的核心观点,但是具体我对林夕的了解,林夕其实是一直活在过去中的。
所以,我也可以得出这样的一个结论:
林夕的昨天,是给杨千嬅去阐述的;
林夕的今天,是给王菲去阐述的;
林夕的明天,是给陈奕迅去阐述的。
通过这些分析,我们可以大概得到这样的一个结论:
林夕是一个典型的抑郁型性格,先总结提取负面,在通过这些负面来劝慰别人要积极正面。又是一个现实主义者,也就是一个理智的人,虽然他的负面较大,但都能通过理性来控制。
欢迎关注网络安全、数据分析博客:
http://www.secange.com/
网络安全、数据分析公众号-杂术馆,扫描二维码关注 image.png
网友评论