美文网首页
利用python生成词云

利用python生成词云

作者: lbship | 来源:发表于2019-07-09 11:27 被阅读0次

利用python的wordcloud包生成词云,分析前程无忧数据分析岗位的岗位职责和岗位要求

import pandas as pd

import jieba,re

from scipy.misc import imread

from wordcloud import WordCloud, ImageColorGenerator,STOPWORDS

import matplotlib.pyplot as plt

data=pd.read_excel('51jobanaly1.xlsx')#读取Excel转为dabaframe

df=pd.DataFrame(data)

nrows=df.shape[0]#获得一共有多少行

file1=df.岗位职责.dropna(how='any')#去掉空值

file2=df.岗位要求.dropna(how='any')

text1=''.join(i for i in file1)#把所有字符串连接成一个长文本

text2=''.join(i for i in file2)

responsibility=re.sub(re.compile(',|;|\.|、|。'),'',text1)#去掉逗号等符号

requirement=re.sub(re.compile(',|;|\.|、|。'),'',text2)

wordlist1=" ".join(jieba.cut(responsibility,cut_all=True))#分析岗位职责

#wordlist1=" ".join(jieba.cut(requirement,cut_all=True))#分析岗位要求

font_path=r'C:\Windows\Fonts\simkai.ttf'

stopwords = list(STOPWORDS)+['数据','分析','负责','相关','公司','进行','工作']#分析岗位职责

#stopwords = list(STOPWORDS)+['以上学历','优先','计算','经验','学历','上学','熟练','使用','以上']#分析岗位要求

bgimg=imread(r'C:\Users\lbship\Desktop\mice.jpg')#设置背景图片

wc = WordCloud(font_path=font_path,  # 设置字体

              background_color="white",  # 背景颜色

              max_words=2000,  # 词云显示的最大词数

              stopwords = stopwords,        # 设置停用词

              mask=bgimg,  # 设置背景图片

              max_font_size=100,  # 字体最大值

              random_state=42,#设置有多少种随机生成状态,即有多少种配色

              width=1000, height=860, margin=2,# 设置图片默认的大小,margin为词语边缘距离

              ).generate(wordlist1)

image_colors = ImageColorGenerator(bgimg)#根据图片生成词云颜色

plt.imshow(wc)

plt.axis("off")

plt.savefig("examples.jpg")#必须在plt.show之前,不是图片空白

plt.show()

效果


image.png

相关文章

  • 利用Python生成词云

    用到的模块 matplotlib 用来画图 wordcloud 生成词云 jieba 中文分词 numpy ...

  • 利用python生成词云

    利用python的wordcloud包生成词云,分析前程无忧数据分析岗位的岗位职责和岗位要求 效果

  • 用Python生成词云

    以下为简单的Python生成词云代码。基于Python3.7,macOS 10.14.2

  • python 词云生成

    背景 最近在研究一些深度学习序列模型,比如RNN和LSTM,这种主要来处理时序数据的神经网络。传统的语言模型主要是...

  • python 生成词云

    各参数解释(部分) 具体实现 结果 自定义一个字体颜色 注:运行过程,缺什么库导什么库

  • python生成词云

    “词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。 “词云”就是...

  • python生成词云

    生成词云还挺简单的。就用wordcloud库就可以生成。WordCloud用的内容可以是字符串,也可以是dict....

  • Python3 生成中文词云

    前提 Python 生成中文词云主要用到两个依赖库: jieba:中文分词工具 wordcloud:词云生成工具 ...

  • Python jieba分词、词云、文件读取、函数调用、匿名函数

    词云的生成 使用wordcloud 库生成词云 安装wordcloud 调用wordcloud类,生成词云对象 词...

  • python 词云模块:wordcloud

    参考:生成词云之python中WordCloud包的用法https://amueller.github.io/wo...

网友评论

      本文标题:利用python生成词云

      本文链接:https://www.haomeiwen.com/subject/haztkctx.html