美文网首页
使用Python一秒看完十九大报告

使用Python一秒看完十九大报告

作者: CC先生之简书 | 来源:发表于2017-10-19 12:57 被阅读180次
    19meeting.png

    使用到的知识点:

    • 制作词云的基本步骤和原理
    • Python3实现词云制作
    • wordcloud扩展包的使用
    • 使用图片制作词云,分析十九大的关键词

    思路:
    词云的原理是对输入的文本数据进行词频统计,根据词汇出现频率的不同,按不同比例显示出词汇,生成图片。频率高的词汇显示的大,频率低的词汇显示的小。文本数据可以是本地数据,也可是是爬虫动态从网络中获取的。

    需要安装包:
    $ pip install numpy
    $ pip install python-matplotlib
    $ pip install python-pil
    $ pip install wordcloud

    实现代码:

    from os import path
    from wordcloud import WordCloud
    import numpy as np
    from PIL import Image
    from os import path
    import matplotlib.pyplot as plt
    import random
    
    d = path.dirname(__file__)
    # 使用numpy中的mask
    mask = np.array(Image.open(path.join(d, "stormtrooper_mask.png")))
    
    # 读取数据来源
    text = open(path.join(d, '19meeting.txt')).read()
    
    # 生成词云图片
    wordcloud = WordCloud().generate(text)
    
    # 显示生成的图片
    wc = WordCloud(max_words=2000, mask=mask, margin=10,
                   random_state=1).generate(text)
    
    plt.figure()
    plt.imshow(wc)
    plt.axis("off")
    plt.show()
    

    以上代码里面用到了两个文件,一个是词云的原图片(可以看得出来原图片是什么吗?哈哈),一个是十九大报告的原文。

    看,是不是秒读 十九大报告。

    相关文章

      网友评论

          本文标题:使用Python一秒看完十九大报告

          本文链接:https://www.haomeiwen.com/subject/yikuuxtx.html