美文网首页
python统计《论语》里的词频

python统计《论语》里的词频

作者: 心际花园 | 来源:发表于2020-09-21 12:58 被阅读0次

利用jieba库统计《论语》里的词频

`#CalLunyuV1.py`

`import jieba`

`txt = open("lunyu.txt", "r", encoding = "utf-8").read()`

`words = jieba.lcut(txt)`

`counts = {}`

`for word in words:`

    `if len(word) ==1:`

        `continue`

    `else:`

        `counts[word] = counts.get(word,0) +1`

`items = list(counts.items())`

`items.sort(key=lambda x:x[1],reverse=True)`

`for i in range(15):`

    `word, count = items[i]`

    `print("{0:<10}{1:>5}".format(word,count))`

结果显示

君子 63

孔子 34

子路 34

可以 25

夫子 23

仁者 22

何如 20

可谓 19

子贡曰 18

不知 16

小人 15

不可 15

颜渊 15

子贡 12

不能 12

结果说明:君子是孔子及门徒经常强调的概念,子路是和孔子交往频次最多的,其次是子贡和颜渊。

相关文章

  • python统计《论语》里的词频

    利用jieba库统计《论语》里的词频 `#CalLunyuV1.py` `import jieba` `txt =...

  • python统计词频

    一、最终目的 统计四六级真题中四六级词汇出现的频率,并提取对应的例句,最终保存到SQL数据库中。 二、处理过程 1...

  • python统计词频

    一、使用re库进行识别 1、代码 2、参考 python--10行代码搞定词频统计python:统计历年英语四六级...

  • python 词频统计

    """Count words.""" def count_words(s, n): """Return the...

  • Python | 词频统计

    最近工作蛮忙的,就简单练习一下python基础吧。 本周的练习是词频统计,主要使用了以下几个函数: text.sp...

  • Python词频统计

    场景: 现在要统计一个文本中的词频,然后按照频率的降序进行排列

  • Python词频统计

    1.合并数据文件 2.词频统计

  • python词频统计实例

    项目概述 通过两个Python文件实现一个简单的词频统计。 本工程共有4个文件: file01:要统计的词频文件。...

  • Python 进行词频统计

    1. 利用字典map实现 2.利用collections模块中的Counter对象 3. 算法:...

  • Python实现词频统计

    《百年孤独》词频统计 学习更多?欢迎关注本人公众号:Python无忧

网友评论

      本文标题:python统计《论语》里的词频

      本文链接:https://www.haomeiwen.com/subject/fqxuyktx.html