美文网首页自然语言处理(NLP)python
利用Python统计2019年工作报告中的关键词和词频

利用Python统计2019年工作报告中的关键词和词频

作者: 传习者戚 | 来源:发表于2019-03-13 18:03 被阅读5次
# author:传习者戚
# email:qijiuzhu@tsinghua.org.cn
# 2019年3月

from snownlp import SnowNLP
import time

# 计时开始
TIME_FORMAT = '%Y-%m-%d %H:%M:%S'
print('{} START'.format(time.strftime(TIME_FORMAT)))

# +++++++++++++++++++++++++++++++++
# 读取文章内容,数据格式是列表list
with open("2019工作报告.txt", "r", encoding="utf-8") as f:
    text_list = f.readlines()
text_string = "".join(t for t in text_list)  # 将列表转为文本字符串str

# 中文字符串处理类
s = SnowNLP(text_string)

# 统计关键词
keywords = s.keywords(10)  # 统计关键词的方法:s.keywords(n) 前n个关键词
print("关键词:", keywords)
#
# 分词
words = s.words  # 分词列表
w = list()
w.append(words)  # 分词列表,列表元素为列表

s = SnowNLP(w)
tf = s.tf  # 词频
for dictionary in tf:
    for k, v in sorted(dictionary.items(), key=lambda d: d[1], reverse=True):
        if len(k) > 1:
            print("%s\t\t%d" % (k, v))
# +++++++++++++++++++++++++++++++++
print()
# 计时结束
print('{} STOP'.format(time.strftime(TIME_FORMAT)))

关键词:
['发展', '改革', '企业', '推进', '经济', '政策', '新', '建设', '服务']


词频:
发展 133
改革 105
经济 65
推进 57
政策 56
企业 55
加强 50
建设 47
社会 44
创新 43
市场 41
加快 40
推动 40
政府 39
全面 38
支持 38
中国 37
服务 36
完善 36
基本 31
坚持 31
深化 31
就业 30
继续 30
促进 30
……

相关文章

  • 利用python统计《十九大报告》中的关键词和词频

    利用python统计《十九大报告》中的关键词、报告摘要和词频。引用snowNLP。得到的结果: 1、关键词:前五个...

  • 利用Python统计2019年工作报告中的关键词和词频

    关键词:['发展', '改革', '企业', '推进', '经济', '政策', '新', '建设', '服务']...

  • Python竟然还可以这样玩?

    对《还珠格格》进行词频统计 对《还珠格格》的词频统计生成词云标签 将《2016年中国政府工作报告》变成词云是这样的...

  • 文本挖掘

    1文本词频分析(中英文各一份)及列表的sort()使用2如何利用python统计英文文章词频3主题模型 LDA 入...

  • Python中简单的词频统计

    用的是ipython notebook1.框架是打开文件,写入文件 def count(in_file,out_f...

  • python统计词频

    一、最终目的 统计四六级真题中四六级词汇出现的频率,并提取对应的例句,最终保存到SQL数据库中。 二、处理过程 1...

  • python统计词频

    一、使用re库进行识别 1、代码 2、参考 python--10行代码搞定词频统计python:统计历年英语四六级...

  • python 词频统计

    """Count words.""" def count_words(s, n): """Return the...

  • Python | 词频统计

    最近工作蛮忙的,就简单练习一下python基础吧。 本周的练习是词频统计,主要使用了以下几个函数: text.sp...

  • Python词频统计

    场景: 现在要统计一个文本中的词频,然后按照频率的降序进行排列

网友评论

    本文标题:利用Python统计2019年工作报告中的关键词和词频

    本文链接:https://www.haomeiwen.com/subject/rjitmqtx.html