美文网首页我爱编程程序员
通过简单几行Python语句,统计文本单词词频

通过简单几行Python语句,统计文本单词词频

作者: e7ec0c4573b1 | 来源:发表于2018-12-23 17:18 被阅读14次

我们常常看到很多英语培训方面的书籍,告诉你考研、雅思、四六级等听力、阅读的高频单词有哪些。他们是怎么做到的呢?

其实通过Python, 通过简单几行代码就可以实现。

import re    #导入正则表达式

from collections import Counter #导入python的统计模块

txt =open('test.txt', 'r').read().lower() #打开要统计的文本

def word_count(num):

word_pattern =r'[a-zA-Z-]+' #正则表达式,搜集文本

words = re.findall(word_pattern, txt) #查询文本,筛选符合单词特征的,去除不符合的汉字图表等

return Counter(words).most_comm(num) #返回你向统计的前几名的高频单词,num输入你的想定义的前几名,num = 10,代表统计前十名的高频单词

很神奇,简单几行代码就实现了统计高频单词。通过延伸应用,还可以统计哪些文字是该文章的核心关键词。

相关文章

  • 通过简单几行Python语句,统计文本单词词频

    我们常常看到很多英语培训方面的书籍,告诉你考研、雅思、四六级等听力、阅读的高频单词有哪些。他们是怎么做到的呢? 其...

  • 通过简单几行Python语句,统计文本单词词频

    我们常常看到很多英语培训方面的书籍,告诉你考研、雅思、四六级等听力、阅读的高频单词有哪些。他们是怎么做到的呢? 其...

  • python词频统计实例

    项目概述 通过两个Python文件实现一个简单的词频统计。 本工程共有4个文件: file01:要统计的词频文件。...

  • 【2020-02-25】leetcode shell

    192、词频统计写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。 为了简单起见...

  • shell题

    统计词频 写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。 为了简单起见,你可...

  • bash题目汇总

    1.统计词频:写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。 为了简单起见,...

  • bash统计词频

    leetcode题目192.统计词频写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的...

  • 「脚本」词频统计 & 有效电话号码

    00192 词频统计 题目描述 写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率...

  • 文本挖掘

    1文本词频分析(中英文各一份)及列表的sort()使用2如何利用python统计英文文章词频3主题模型 LDA 入...

  • 如何使用python实现词云

    如果想要生成词云图,首先我们需要对输入的文本进行词频统计。这里我们使用的是《小王子》中的一段文本进行统计: 词频统...

网友评论

    本文标题:通过简单几行Python语句,统计文本单词词频

    本文链接:https://www.haomeiwen.com/subject/czpnkqtx.html