美文网首页
Python生成词云(解决中文词云乱码)

Python生成词云(解决中文词云乱码)

作者: Zero_st | 来源:发表于2019-05-13 15:40 被阅读0次

第一:先准备生成词云要用户的文本以及图片
我这边是自己做了一个“洛神赋”三个字的图片,
以及从网上拷贝了《洛神赋》的正文


pic.png

第二:需要安装的第三方库 
Pillow、wordcloud、jieba、numpy

具体代码如下:

from PIL import Image
from wordcloud import WordCloud
import jieba
import numpy as np

#1:打开词云文本
txt = open("D:\\0000_2018_python_study\\1_programma\\source\\txt.txt","rb").read()
#2:用jieba进行分词
txtout = "".join( jieba.cut(txt,cut_all=False) )

#3:读取词云图片
mask_pic = Image.open("D:\\0000_2018_python_study\\1_programma\\source\\pic.png")
mask_pic_array = np.array(mask_pic)#将词云图片转换为数组

#4:设置词云的属性
font = "C:\\Windows\\Fonts\\STXINGKA.TTF"#词云的中文字体所在路径
wc = WordCloud(font_path = font,
               background_color="white",
               mask = mask_pic_array,
               contour_width=5, 
               contour_color="lightblue",
               )

#5:生成词云
wc.generate(txtout)

#6:存储词云
wc.to_file("D:\\0000_2018_python_study\\1_programma\\source\\cy.png")

最后的效果是这样的(哈哈,丑哭)


cy.png

备注:
需要在wordcloud中设置你使用到的中文字体,
也就是wordcloud的font_path属性不要漏掉,否则中文会产生乱码

font = "C:\\Windows\\Fonts\\STXINGKA.TTF"#词云的中文字体所在路径
wc = WordCloud(font_path = font,#这里要设置,否则中文会乱码
               background_color="white",
               mask = mask_pic_array,
               contour_width=5, 
               contour_color="lightblue",
               )

相关文章

  • Python生成词云(解决中文词云乱码)

    第一:先准备生成词云要用户的文本以及图片我这边是自己做了一个“洛神赋”三个字的图片,以及从网上拷贝了《洛神赋》的正...

  • Python3 生成中文词云

    前提 Python 生成中文词云主要用到两个依赖库: jieba:中文分词工具 wordcloud:词云生成工具 ...

  • 教你用python 画词云

    词云是挺有意思的一个库,但其默认不支持中文字体,一读中文就乱码 下面分享下从根本上解决乱码问题的方法。解决中文词云...

  • NLTK之统计词频,去除停用词,生成词云(一)

    导包 获取网络文本,清除干扰词 获取词频 去除停用词,画词频曲线图 中文分词 生成中文词云 生成英文词云 生成效果图

  • python 词云生成

    背景 最近在研究一些深度学习序列模型,比如RNN和LSTM,这种主要来处理时序数据的神经网络。传统的语言模型主要是...

  • python 生成词云

    各参数解释(部分) 具体实现 结果 自定义一个字体颜色 注:运行过程,缺什么库导什么库

  • python生成词云

    “词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。 “词云”就是...

  • python生成词云

    生成词云还挺简单的。就用wordcloud库就可以生成。WordCloud用的内容可以是字符串,也可以是dict....

  • 用Python生成词云

    以下为简单的Python生成词云代码。基于Python3.7,macOS 10.14.2

  • python 词云模块:wordcloud

    参考:生成词云之python中WordCloud包的用法https://amueller.github.io/wo...

网友评论

      本文标题:Python生成词云(解决中文词云乱码)

      本文链接:https://www.haomeiwen.com/subject/rjxraqtx.html