百度的文章基本都是同一篇,秘技反复横跳。
本着惩前毖后,治病救人的原则,写下此博客
首先,我是用的anaconda,不过原生python,据我推测应该不会有原则性区别 。
在bash或者你的脚本中
import nltk
nltk.download()
这里前者会在控制台中显示一个简易的,后者会显示一个图形的安装器,在安装器里把所有的东西都下载过来,如果下载太慢,可以从github
上下载,然后把package里面的东西拖到安装器里面说的路径下面
其他博客的问题在于,他说的是把package改名放到nltk_data下面,但实际上已经有nltk_data文件夹了。
之后你运行nltk,比如说你要用分词tokenize函数,他会提示你找不到punkt,然后你按照他们的教程,去安装器的model下面下载这个东西,但是这里是不对的,有了上面的操作即便你打开安装器也会显示punkt安装好了,重点来了,再打开前面nltk_data路径,把
里面对应的压缩包都解压了,比如我要用tokenuzer下的punkt就解压这个
问题解决,重新运行,如果还有别的函数说找不到,如法炮制。
只会复制别人东西的,写个教程错了还不及时改正的,都是屑
网友评论