Emmm... 今晚想摸鱼。想起来下午看到某个提问,如主题。
这个功能其实很容易实现:
- 提取PDF中所有文本
- 统计文本中的词频
说干就干,反正简单。我顺手就打了一个 TBtools 插件
![](https://img.haomeiwen.com/i10518391/d4c6287a7e97750e.png)
Paper PDF Word Frequency
可以直接在 TBtools 插件商店安装。
![](https://img.haomeiwen.com/i10518391/0946996742d38b74.png)
windows 和 macOS 操作相同。安装结束之后就可以打开界面。
- 把一堆文献的 PDF 放进去
- 设置必要的参数(或者其实你啥都不用管,默认参数已经够好了)
- 点击 Start
于是可以看到统计之后的词频,第一类是出现次数,第二列是单词。
注意到,其中有一个我自己简单内置的过滤单词,这些单词统计也没啥用,比如 the an a is was were
欢迎大伙补充内置过滤的单词表过来,我补充进去
写在最后
顺手谢谢,半个小时搞定。欢迎使用~如果真的有用,记得告诉我。
网友评论