先发感叹:Python真强大,用来做业务,太轻松了。
作为一个没怎么接触过Python的小白,我只用了十多行代码,就生成了漂亮的词云图片。
总结一下步骤吧。
Anoconda
入门文章都在推荐这款神器。
新生成了python目录,用pip下包的时候,会下载在这个新目录里,新建工程的时候,也记得选择对应的目录。
如果以后要建3.0环境,再生成3.0目录,做到互不影响。
WordCloud
核心包,使用如下:
wc = WordCloud(background_color = 'white',
max_words = 500,
mask = alice_coloring,
max_font_size = 60,
random_state = 102,
scale = 1,
font_path = path.join(d, 'HYZhongJianHeiJ.ttf')).generate(wl_space_split)
wc.recolor(color_func=img_colors)
wc.to_file(path.join(d, 'h16.jpg'))
jieba
最开始输入的是一个整篇的文章,提示错误:
ValueError: We need at least 1 word to plot a word cloud, got 0.
猜测是说输入没有分词的原因,于是去下了jieba。
中文分词利器,使用如下:
text = open(path.join(d, 'df.txt')).read()
wordlist = jieba.cut(text, cut_all = True)
wl_space_split = ' '.join(wordlist)
就这么简单两步,图片就出来啦!
h16.jpg
感想
虽然步骤很简单,但参数还是调了半天,才出一张比较好的图片。台上一分钟,调参十年功。
网友评论