Python分词、词云

Python分词、词云

作者: 家琦的三亩地 | 来源:发表于2016-11-12 10:25 被阅读0次

Python分词、词云
python-结巴分词+词云展示
Python3 生成中文词云
常用分词工具使用教程
jieba python中文分词库快速入门
分析自己在大学期间读过的书（二）
python 数据词云展示实例（2）- jieba库的使用
Python分析《我不是药神》豆瓣评论
词云：jieba分词
jieba分词基本使用

使用Python的结巴分词，但是排除一些词的代码好像运行没生效，可能是dataframe里面的一些方法没掌握，用了R处理这种类型的统计数据，感觉比Python方便些。

# -*- coding: utf-8 -*-
import jieba
import numpy
import pandas
# 解决编码
import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )
# 没问题何以删掉
# 打开语料文件，获取文本
my_file =open('bt.txt', 'r') 
content = my_file.read()
my_file.close()
# 分词
segments = []
segs = jieba.cut(content, cut_all=False) # 使用精确模式
for seg in segs:
    if len(seg)>1:
        segments.append(seg)
segmentDF = pandas.DataFrame({'segment':segments})
segStat = segmentDF.groupby(
by=["segment"]
)["segment"].agg({
"num":numpy.size
}).reset_index().sort(
columns=["num"],
ascending=False
);

result = segStat.head(500)
segStat.to_csv('result2.csv', sep='\t')

print result
wordcloud = WordCloud(
font_path='D:\\simhei.ttf',
background_color="black",
width=800,height=400
)
wordcloud = wordcloud.fit_words(segStat.head(1000).itertuples(index=False))
wordcloud.to_file('filename4.jpg')

相关文章

Python分词、词云
使用Python的结巴分词，但是排除一些词的代码好像运行没生效，可能是dataframe里面的一些方法没掌握，用了...
python-结巴分词+词云展示
python-结巴分词+词云展示需要库结果快览制作步骤准备文档字符串，并进行结巴分词准备词云底图形状的图...
Python3 生成中文词云
前提 Python 生成中文词云主要用到两个依赖库： jieba：中文分词工具 wordcloud：词云生成工具 ...
常用分词工具使用教程
Python 简单的文本关键词提取 - 简书常用分词工具使用教程以下分词工具均能在Python环境中直接调用（...
jieba python中文分词库快速入门
jieba python中文分词库快速入门关键词提取
分析自己在大学期间读过的书（二）
前情提要昨天，我使用结巴分词跟词云两个 python 库，达到了提取读书记录频率及按照词频高低显示...
python 数据词云展示实例（2）- jieba库的使用
记录中文分词库jieba的使用、参数及样板之前简单的介绍了jieba库的使用，python 数据词云展示实例（1...
Python分析《我不是药神》豆瓣评论
读取 Mongo 中的短评数据，进行中文分词对分词结果取 Top50 生成词云生成词云效果看来网上关于我不是...
词云：jieba分词
jieba是中文分词工具，安装很简单直接pip install jiebagithub:https://githu...
jieba分词基本使用
jieba “结巴”中文分词：做最好的 Python 中文分词组件算法基于前缀词典实现高效的词图扫描，生成句子...

网友评论

本文标题：Python分词、词云

本文链接：https://www.haomeiwen.com/subject/mzxtpttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Python分词、词云|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！