美文网首页ITS·黑客
小实验3:十行代码写词云

小实验3:十行代码写词云

作者: JEZAU | 来源:发表于2017-04-06 08:06 被阅读0次

    第一行
    import matplotlib.pyplot as plt
    导入matplotlib.pyplot库并命名为plt 这样后面写包名只需要写plt,可以改成其他
    import matplotlib.pyplot as a
    a.show()
    matplotlib是python的一个绘图的库,可以绘制各种矩阵图形,会显示一个绘图的界面,就像pygame会显示一个游戏界面。里面包含pylab和pyplot等子库。

    第二行from wordcloud import WordCloud
    第三行import jieba
    jieba为结巴分词库
    支持三种分词模式:
    a,精确模式,试图将句子最精确地切开,适合文本分析;
    b,全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;
    c,搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。

    第四行 text_from_file_with_apath = open('文件路径/文件名.拓展名').read()
    读取文件中的内容

    第五行wordlist_after_jieba = jieba.cut(text_from_file_with_apath, cut_all = True)
    jieba.cut方法接受两个输入参数: 1) 第一个参数为需要分词的字符串 2)cut_all参数用来控制是否采用全模式
    第六行 wl_space_split = " ".join(wordlist_after_jieba)
    文字中间以空格为分界隔开,变成一个list
    因为jieba分词后的结果是一个string,各个词中间用空格隔开

    第七行my_wordcloud = WordCloud().generate(wl_space_split)
    把list构成词云
    第八行 plt.imshow(my_wordcloud)
    绘制热度图,大概是 显示不同的颜色
    第九行 plt.axis("off”)
    坐标轴的最值,无,这句话可以不写
    plt.axis([xmin, xmax, ymin, ymax])
    第十行 plt.show()显示图片


    pyplot库尝试
    import matplotlib.pyplot as plt
    plt.plot([1,2,3,4]) 默认绘制y轴,x轴默认从0开始,为0,1,2,3...
    plt.ylabel('some numbers',fontsize=16)y轴的标题以及更改大小
    plt.xlabel('some numbers')x轴的标题
    plt.show()显示图片
    plt.close() close the current figure

    plt.plot([1,2,3,4], [1,4,9,16]) 分别为x轴,y轴的坐标


    更改字体
    FONT_PATH = os.environ.get("FONT_PATH", os.path.join(os.path.dirname(file), "字体.ttf"))

    相关文章

      网友评论

        本文标题:小实验3:十行代码写词云

        本文链接:https://www.haomeiwen.com/subject/rvefattx.html