美文网首页
背单词 | 批量统计英文文献PDF的词频

背单词 | 批量统计英文文献PDF的词频

作者: 生信石头 | 来源:发表于2023-08-07 22:56 被阅读0次

Emmm... 今晚想摸鱼。想起来下午看到某个提问,如主题。
这个功能其实很容易实现:

  1. 提取PDF中所有文本
  2. 统计文本中的词频

说干就干,反正简单。我顺手就打了一个 TBtools 插件


Paper PDF Word Frequency

可以直接在 TBtools 插件商店安装。



windows 和 macOS 操作相同。安装结束之后就可以打开界面。

  1. 把一堆文献的 PDF 放进去
  2. 设置必要的参数(或者其实你啥都不用管,默认参数已经够好了)
  3. 点击 Start

于是可以看到统计之后的词频,第一类是出现次数,第二列是单词。
注意到,其中有一个我自己简单内置的过滤单词,这些单词统计也没啥用,比如 the an a is was were
欢迎大伙补充内置过滤的单词表过来,我补充进去

写在最后

顺手谢谢,半个小时搞定。欢迎使用~如果真的有用,记得告诉我。

相关文章

  • 开启自学人生

    day6 姓名:邓超 学号:1901010076 学习:封装统计英文词频的函数+封装统计中文词频的函数。 总结:1...

  • 【【python实战】根据DOI号批量下载参考文献

    在上一篇中,写了如何获取某篇英文文献pdf的参考文献信息。【python实战】获取英文文献pdf中参考文献信息[h...

  • 英文词频统计

    该案例以莎士比亚的四大悲剧之一《哈姆雷特》为例,来统计该文章中的词语出现的频率。总体的步骤为读入文本,大小写转换,...

  • 文本挖掘

    1文本词频分析(中英文各一份)及列表的sort()使用2如何利用python统计英文文章词频3主题模型 LDA 入...

  • 统计英文文章中词频

    import refrom collections import Counterpath='E:\etest.tx...

  • 用Py做文本分析3:制作词云图

    1.词频统计 在词频统计之前,需要先完成分词工作。因为词频统计是基于分词后所构建的list进行的。 1.1使用Pa...

  • Schedule

    1.英语 老外的homework quizlet 听听力 练句 阅读 书籍和新闻 背单词 2.文献 英文文献两周一...

  • 词频统计

    通过Linux命令实现词频统计 现在有一遍英语文档The_Man_of_Property.txt通过Linux命令...

  • 词频统计

    词频统计 请设计一个高效的方法,找出任意指定单词在一篇文章中的出现频数。 给定一个string数组article和...

  • 2019-09-09

    今天是星期一 看书30页 查资料 读英文文献 做英语卷子 背单词

网友评论

      本文标题:背单词 | 批量统计英文文献PDF的词频

      本文链接:https://www.haomeiwen.com/subject/khfnpdtx.html