词云

作者: zengcity | 来源:发表于2018-08-15 18:41 被阅读76次

先发感叹:Python真强大,用来做业务,太轻松了。
作为一个没怎么接触过Python的小白,我只用了十多行代码,就生成了漂亮的词云图片。
总结一下步骤吧。

Anoconda

入门文章都在推荐这款神器。
新生成了python目录,用pip下包的时候,会下载在这个新目录里,新建工程的时候,也记得选择对应的目录。
如果以后要建3.0环境,再生成3.0目录,做到互不影响。

WordCloud

核心包,使用如下:

wc = WordCloud(background_color = 'white',
               max_words = 500,
               mask = alice_coloring,
               max_font_size = 60,
               random_state = 102,
               scale = 1,
               font_path = path.join(d, 'HYZhongJianHeiJ.ttf')).generate(wl_space_split)
wc.recolor(color_func=img_colors)
wc.to_file(path.join(d, 'h16.jpg'))

jieba

最开始输入的是一个整篇的文章,提示错误:

ValueError: We need at least 1 word to plot a word cloud, got 0.

猜测是说输入没有分词的原因,于是去下了jieba。
中文分词利器,使用如下:

text = open(path.join(d, 'df.txt')).read()
wordlist = jieba.cut(text, cut_all = True)
wl_space_split = ' '.join(wordlist)

就这么简单两步,图片就出来啦!


h16.jpg

感想

虽然步骤很简单,但参数还是调了半天,才出一张比较好的图片。台上一分钟,调参十年功。

相关文章

  • 词云

    以前总看到豆瓣知乎上各种晒词云的图片,乍一看高大上,于是今天潜心研究了一下python词云的几个库:wordclo...

  • 词云

    先发感叹:Python真强大,用来做业务,太轻松了。作为一个没怎么接触过Python的小白,我只用了十多行代码,就...

  • 词云

    勤问,不要感觉自己有多厉害,三人行也必有我师,勤学多问是进步的良方

  • 词云

    方文山和林夕都是作词大家,我仅以《青花瓷》和《红豆》两首歌作为例子,来比较一下两者文风的不同。 中文版 英文版

  • 词云

    一、林夕作词的《不要爱他》与方文山作词的《菊花台》词频对比 二、BBC与CNN报道ISIS在摩苏尔战斗的报道

  • 词云

    中文词云 比较搜狐财经和网易财经在“美国总统大选电视辩论”后第二天的相关评论。 英文词云 泰戈尔和狄兰·托马斯诗作...

  • 词云

    一. 中文歌词对比 SHE的《安静了》和周杰伦的《借口》两首歌都是由周杰伦作曲,曲调相同但填词者不同。 1.SHE...

  • 词云

  • 词云

    文章链接[https://www.yuque.com/mchax/rs/etm065] 加载拓展包 Rwordse...

  • Python jieba分词、词云、文件读取、函数调用、匿名函数

    词云的生成 使用wordcloud 库生成词云 安装wordcloud 调用wordcloud类,生成词云对象 词...

网友评论

      本文标题:词云

      本文链接:https://www.haomeiwen.com/subject/qknwbftx.html