美文网首页Python数据.处理.分析.可视化互联网科技玩转大数据
soda学python-原来周杰伦最喜欢用的四个字是..

soda学python-原来周杰伦最喜欢用的四个字是..

作者: soda哒哒 | 来源:发表于2017-08-02 16:57 被阅读626次

我是那个分析了孙燕姿的4万歌词,觉得要注孤生了po主。很意外也很开心受到大家这么多关注。楼主不是程序员,是个完完全全的小白,得到大家这么多鼓励还有很多真大神的指导,让我更有信心坚持下去了,谢谢大家!
之前的教程因为主要是记录学习的过程,所以写的比较繁琐,而且也有很多很多不足的地方,包括有需要手工的部分,可移植性不强等等...因为收到很多朋友的私信,求自己爱豆的图,所以这里再贴一个改进版一键式成图教程。
哦,言归正传 周总最喜欢的四个字是哈哈哈哈

周杰伦_4.png

程序及相关配置文件在这里下载

链接:http://pan.baidu.com/s/1gff6ZLL 密码:exo9

图片.png

文件夹叫Soda_song,包括三个文件

  • All_one.py是主程序
  • ID_list是我已经抓好的歌手在该网站对应的ID
  • msyh.ttc是绘制词云所用的微软雅黑字体

接着准备开发环境

  • 当然第一件事就是安装python咯。楼主是用的Anaconda3(64bit) 安装可以参见这里https://jingyan.baidu.com/article/fd8044faca4cd75031137ac8.html
  • 第二步安装包 文件运行需要的包有numpy,pandas,requests,warning,bs4,re,jieba,wordcloud,codecs
    Anaconda已经自带了很多包,楼主只记得安装jieba和wordcloud是自己安装的。
    安装包很简单,以安装jieba为例
    1.win+R后输入cmd打开命令行
    2.输入 pip install jieba
图片.png

3.其他包安装类似

最后就跑程序吧

在命令行下切换到Soda_song文件夹,并输入python All_one.py 回车运行程序

图片.png

因为楼主真的很小白,所以尽力了程序的效率也不高

  • 输入歌手名:输入你爱豆的名字 回车


    图片.png
  • 选择词云类型:比如像看四字的,就输入数字4。看所有词一起的就输入0


    图片.png

    -等待。。。。

图片.png

因为po主真的很渣,所以你可能需要好几杯茶,等我成长了会再来改进的!

图片.png

啦啦 出结果啦

图片.png

文件夹下孙燕姿4.png即是结果


孙燕姿_4.png

额。。写到最后才发现明明是周总,不知不觉又写成我姿了.sigh...
那么,再附录几个

陈奕迅

陈奕迅_4.png

蔡依林

蔡依林_4.png

梁静茹

梁静茹_4.png

大家有成功的,欢迎返图!
另外 以上仅供娱乐 因为数据清洗全自动了 所以不够干净 结果可能不太严谨

相关文章

网友评论

  • 子路的出海日记:海滨快奔跑: @海滨快奔跑 r"\],{0,10}曲.?:.*?\["
    是什么意思,我在正则表达式的一些文档里,没有看过\[ 或者\]
    soda哒哒: @海滨快奔跑 推荐http://regexr.com/这个网站
    soda哒哒: @海滨快奔跑 这个是后来我写的时候发现除了作曲还有编曲……观察了一下他们共同特点以后写的
    soda哒哒: @海滨快奔跑 你找找正则式里的\就是转义符的说明……嗯就是你想表达[但是,在正则式里对这个东西已经有定义了,你要表达它真正的含义,就得加转义符
  • 子路的出海日记:不是很看的懂歌词清洗函数里的正则表达式,可以稍微说一下吗?
    soda哒哒: @海滨快奔跑 ^\u4e00-\u9fa5 这个式子表示非中文部分
    soda哒哒: @海滨快奔跑 比如我想删除每个歌里面的"作曲:某某某" ,因为某某某可能是三个字,两个字,或者多人,字数不确定。观察这部分都是]作曲:某某某[ 所以可以用一个中括号来标记结尾,那么换句话说我们要写个式子,作曲开头,中括号结尾,中间字符数不确定……
    soda哒哒: @海滨快奔跑 r'\作曲.*?\[') 中(.*?)表示用中间不确定字符数 (\[)表示结尾中括号
  • 53a106ee672c:刚准备学着做周杰伦的,你就🙃
    soda哒哒: @cengjing 啊,没事,我的程序很多问题呢,欢迎交流

本文标题:soda学python-原来周杰伦最喜欢用的四个字是..

本文链接:https://www.haomeiwen.com/subject/byhylxtx.html