词云

作者: eptsky | 来源:发表于2018-03-15 21:13 被阅读0次

以前总看到豆瓣知乎上各种晒词云的图片,乍一看高大上,于是今天潜心研究了一下python词云的几个库:wordcloud/jieba.
首先参考了一个英文词云,改写代码如下:

from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
# 获取当前文件路径
dir = path.dirname('.')
text = open(path.join(dir, 'English.txt')).read()#英文直接读取
# 设置背景图片
mask_coloring = imread(path.join(dir, "mask.png"))
wc = WordCloud(background_color="white", #背景颜色
                            max_words=2000,# 词云显示的最大词数
                            mask=alice_coloring,#设置背景图片                          
                            max_font_size=80, #字体最大值
                            random_state=80)
wc.generate(text) #分词
image_colors = ImageColorGenerator(mask_coloring) # 从背景图片生成颜色值
# 显示图片
plt.figure()
plt.imshow(wc)
plt.axis("off")
# 绘制词云
plt.figure()
plt.imshow(wc.recolor(color_func=image_colors))  # recolor wordcloud and show
plt.axis("off")
# 绘制背景图片为颜色的图片
plt.figure()
plt.imshow(mask_coloring, cmap=plt.cm.gray)
plt.axis("off")
plt.show()
# 保存图片
wc.to_file(path.join(dir, "wordcloud.png"))

中文分词代码如下:

from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt
import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
# 获取当前文件路径
dir = path.dirname('.')
text1=open(path.join(dir,'chinese.txt')).read()
text2 = jieba.cut_for_search(text1)
text_ch=" ".join(text2)
# 设置背景图片
mask_coloring = imread(path.join(dir, "mask.png"))
wc = WordCloud(font_path='simsun.ttf',mask=mask_coloring,
                    background_color="white", max_words=50,
                    max_font_size=80, random_state=80)
# 生成词云
wc.generate(text_ch)
image_colors = ImageColorGenerator(mask_coloring) # 从背景图片生成颜色值
# 显示图片
plt.figure()
plt.imshow(wc)
plt.axis("off")
# 绘制词云
plt.figure()
plt.imshow(wc.recolor(color_func=image_colors)) # recolor wordcloud and show
plt.axis("off")
# 绘制背景图片为颜色的图片
plt.figure()
plt.imshow(alice_coloring, cmap=plt.cm.gray)
plt.axis("off")
plt.show()
# 保存图片
wc.to_file(path.join(dir, "词云.png"))

原图:

相关文章

  • 词云

    以前总看到豆瓣知乎上各种晒词云的图片,乍一看高大上,于是今天潜心研究了一下python词云的几个库:wordclo...

  • 词云

    先发感叹:Python真强大,用来做业务,太轻松了。作为一个没怎么接触过Python的小白,我只用了十多行代码,就...

  • 词云

    勤问,不要感觉自己有多厉害,三人行也必有我师,勤学多问是进步的良方

  • 词云

    方文山和林夕都是作词大家,我仅以《青花瓷》和《红豆》两首歌作为例子,来比较一下两者文风的不同。 中文版 英文版

  • 词云

    一、林夕作词的《不要爱他》与方文山作词的《菊花台》词频对比 二、BBC与CNN报道ISIS在摩苏尔战斗的报道

  • 词云

    中文词云 比较搜狐财经和网易财经在“美国总统大选电视辩论”后第二天的相关评论。 英文词云 泰戈尔和狄兰·托马斯诗作...

  • 词云

    一. 中文歌词对比 SHE的《安静了》和周杰伦的《借口》两首歌都是由周杰伦作曲,曲调相同但填词者不同。 1.SHE...

  • 词云

  • 词云

    文章链接[https://www.yuque.com/mchax/rs/etm065] 加载拓展包 Rwordse...

  • Python jieba分词、词云、文件读取、函数调用、匿名函数

    词云的生成 使用wordcloud 库生成词云 安装wordcloud 调用wordcloud类,生成词云对象 词...

网友评论

    本文标题:词云

    本文链接:https://www.haomeiwen.com/subject/kdhkqftx.html