美文网首页
词云图制作

词云图制作

作者: 龙小江i | 来源:发表于2018-10-09 16:19 被阅读0次
from wordcloud import WordCloud,STOPWORDS
import matplotlib.pyplot as plt
import jieba
text = open('C:\\Users\\longxiaojiangi\\AppData\\Local\\Packages\\903DB504.QQ_a99ra4d2cbcxa\\LocalState\\User\\1405935821\\NetworkFile\\西游记.txt',encoding='GB18030').read()
X = ' '.join(jieba.cut(text,cut_all = False,HMM=True))
my_wordcloud=WordCloud(
    background_color='white',
    stopwords=STOPWORDS,
    font_path='C:\\Windows\\Fonts\\simsun.ttc')
my_wordcloud.generate(X)
plt.imshow(my_wordcloud)
plt.axis('off')
plt.show()
import pandas as pd
df_news=pd.read_table(r'C:\Users\longxiaojiangi\AppData\Local\Packages\903DB504.QQ_a99ra4d2cbcxa\LocalState\User\1405935821\NetworkFile\news.txt',names=['category','theme','url','content'])
df_health = df_news[df_news.category=='健康']
content_list = df_health.content.values.tolist()
stopwords=pd.read_csv(r'C:\\Users\\longxiaojiangi\\Desktop\\stopwords.txt',sep='\t',quoting=3,names=['stopword'])
stopwords_list = stopwords['stopword'].values.tolist()
import jieba
words = []
seg = jieba.lcut(content_list[0])
for word in seg:
    if word == '\n' or len(word)<=1:
        continue
    elif word in stopwords_list:
        continue
    else:
        words.append(word)
#对500条健康新闻进行分词和预处理
words=[]
for line in content_list:
    seg=jieba.lcut(line)
    for word in seg:
        if word=='\n'or len(word)<=1:
            continue
        elif word in stopwords_list:
            continue
        else:
            words.append(word)
df_health=pd.DataFrame({'health_words':words})
import numpy as np
df_health.groupby(by=['health_words'])['health_words'].agg({'count':np.size})
from wordcloud import WordCloud
import matplotlib.pyplot as plt
%matplotlib inline
cloud = WordCloud(font_path='C:\\Windows\\Fonts\\simsun.ttc',width=500,height=300)
pic_cloud = {x[0]:x[1] for x in words_count_sort.values}
pic_cloud = cloud.fit_words(pic_cloud)
# 绘制词云
plt.imshow(pic_cloud,interpolation='bilinear')
plt.axis('off')
plt.show()

相关文章

  • 制作公众号内容词云图

    上一篇文章介绍了如何制作公众号标题的词云图。 这篇文章介绍制作公众号文章词云图 同样的,制作公众号文章词云图,也要...

  • 词云图制作

  • 词云图

    词云图 词云图是一款可以将文章内容转为词云图的小工具,可以用于制作ppt、统计分析等。app简约、免费、无广告,快...

  • Pyecharts词云图制作教程

    前言 之前我们使用wordcloud库制作了词云图,今天我们就来学习另外一种制作词云图的方法,那就是pyechar...

  • 赘婿词云图制作

    前言 之前的文章我们已经介绍了如何使用wordcloud库制作中英文词云图,并介绍了中英文停用词的使用方法,介绍了...

  • 利用R制作词云图

    制作词云图本不是难事,利用R或者tableau可以轻松制作出花式词云图,但是词源的获取就不是那么容易了,今天我们就...

  • 使用wordcloud制作精美词云图

    使用wordcloud制作精美词云图 一个简单的开始 安装库   wordcloud用来绘制词云图,是今天的主角。...

  • 你真的会用wordcloud制作词云图吗?

    前言 对于文本分析而言,大家都绕不开词云图,而python中制作词云图,又绕不开wordcloud,但我想说的是,...

  • 制作词云图

    今晚主要干了一件事情:制作词云图。 用Python从评价中提取出一些关键词或频率最高的词来做一个词云图。也就是通过...

  • 利用python制作一张词云图

    引言 在数据分析的过程中我们经常会接触到很多词云图,比起干巴巴的数字频率统计,词云图更能吸引读者的眼球。制作词云的...

网友评论

      本文标题:词云图制作

      本文链接:https://www.haomeiwen.com/subject/ehcyaftx.html