美文网首页
利用Python生成词云

利用Python生成词云

作者: FlyingPig_ | 来源:发表于2018-11-23 11:06 被阅读17次

用到的模块

  • matplotlib 用来画图
  • wordcloud 生成词云
  • jieba 中文分词
  • numpy 图像矩阵处理
  • PIL 图像读取

推荐使用jupyter-notebook玩耍

简单的词云

使用默认参数


from wordcloud import WordCloud
import jieba
import matplotlib.pyplot as plt

# 设置工作目录
RUN_PATH = "./word_cloud/" 
# 设置字体
FONT = "_fonts/simhei.ttf"
# 设置文档
FILE_SOURCE = "_source/平凡的世界.txt"

# 文档读取
text_raw = open(RUN_PATH + FILE_SOURCE,'r',encoding = 'UTF-8').read()
# 分词处理
text_jieba = jieba.cut(text_raw,cut_all = True)
text_jieba_space = " ".join(text_jieba)

# 词云生成
wd_gen = WordCloud(font_path = RUN_PATH + FONT, # 字体
                   width = 800,
                   height = 600,
                   background_color = 'black').generate(text_jieba_space)
# 保存图片
plt.imsave(RUN_PATH + FILE_SOURCE[8:].replace('.txt','.png'),wd_gen)
# 图片显示
plt.imshow(wd_gen)
plt.axis("off")
plt.show()

效果(《平凡的世界》)


平凡的世界.png

带蒙版的词云

from wordcloud import WordCloud
import jieba
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image

RUN_PATH = "./word_cloud/"
FONT = "_fonts/simhei.ttf"

FILE_SOURCE = "_source/What_I_talk_about_when_I_talk_about_running.txt"
MASK_IMG = "_mask/nike2.jpg"

text_raw = open(RUN_PATH + FILE_SOURCE,'r',encoding = 'UTF-8').read()
text_jieba = jieba.cut(text_raw,cut_all = True)
text_jieba_space = " ".join(text_jieba)
mask_img = np.array(Image.open(RUN_PATH + MASK_IMG))

wd_gen = WordCloud(font_path = RUN_PATH + FONT,
                   mask = mask_img,
                   contour_width = 3,
                   contour_color = 'steelblue',
                   max_words = 1000,
                   background_color = 'black').generate(text_jieba_space)
plt.imsave(RUN_PATH + FILE_SOURCE[8:].replace('.txt','.png'),wd_gen)
plt.imshow(wd_gen)
plt.axis("off")
plt.show()

效果(《当我谈跑步时我谈些什么》)

What_I_talk_about_when_I_talk_about_running.png

采用自定义的内容

美化

词云生成原理概览

一些好玩的分析

相关文章

  • 利用Python生成词云

    用到的模块 matplotlib 用来画图 wordcloud 生成词云 jieba 中文分词 numpy ...

  • 利用python生成词云

    利用python的wordcloud包生成词云,分析前程无忧数据分析岗位的岗位职责和岗位要求 效果

  • 用Python生成词云

    以下为简单的Python生成词云代码。基于Python3.7,macOS 10.14.2

  • python 词云生成

    背景 最近在研究一些深度学习序列模型,比如RNN和LSTM,这种主要来处理时序数据的神经网络。传统的语言模型主要是...

  • python 生成词云

    各参数解释(部分) 具体实现 结果 自定义一个字体颜色 注:运行过程,缺什么库导什么库

  • python生成词云

    “词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。 “词云”就是...

  • python生成词云

    生成词云还挺简单的。就用wordcloud库就可以生成。WordCloud用的内容可以是字符串,也可以是dict....

  • Python3 生成中文词云

    前提 Python 生成中文词云主要用到两个依赖库: jieba:中文分词工具 wordcloud:词云生成工具 ...

  • Python jieba分词、词云、文件读取、函数调用、匿名函数

    词云的生成 使用wordcloud 库生成词云 安装wordcloud 调用wordcloud类,生成词云对象 词...

  • python 词云模块:wordcloud

    参考:生成词云之python中WordCloud包的用法https://amueller.github.io/wo...

网友评论

      本文标题:利用Python生成词云

      本文链接:https://www.haomeiwen.com/subject/bsdlqqtx.html