![](https://img.haomeiwen.com/i659952/9e3045403db1dc5b.png)
![](https://img.haomeiwen.com/i659952/29d81962e945ec1d.png)
![](https://img.haomeiwen.com/i659952/1a1fd53113f71280.png)
如果用科普类的图书效果也许更加明显
![](https://img.haomeiwen.com/i659952/c7880bb2f0e5485f.png)
程序没有变,只是把文章变成了《果壳中的宇宙》,效果更加明显。
![](https://img.haomeiwen.com/i659952/879e9c7bcf15c4e8.png)
这里再补充一点,自己之前没有注意过的,其实应该能想到,但是之前一直不肯定,迷迷糊糊的,看过代码之后确定了,在这里叨叨一句
![](https://img.haomeiwen.com/i659952/24abc07ba55da9e2.png)
![](https://img.haomeiwen.com/i659952/0bb81da4f7eb9251.png)
![](https://img.haomeiwen.com/i659952/0a251051525b2fae.png)
看代码说明的第一句,这里的统计值,是经过tfidf计算之后的,不单单是词频,而是“重要性”,加上逆文本频率之后的结果。
如果用科普类的图书效果也许更加明显
这里再补充一点,自己之前没有注意过的,其实应该能想到,但是之前一直不肯定,迷迷糊糊的,看过代码之后确定了,在这里叨叨一句
本文标题:读txt文件,并统计词频,自己编辑停词表
本文链接:https://www.haomeiwen.com/subject/slsyaftx.html
网友评论