NLTK 中包括一个用于单词词干提取的类nltk.stemmer.porter.PorterStemmer
,Porter stemmer 并不是要把单词变为规范的那种原来的样子,它只是把很多基于这个单词的变种变为某一种形式!换句话说,它不能保证还原到单词的原本,也就是"created"不一定能还原到"create",但却可以使"create" 和 "created" ,都得到"creat"。
参考链接:
https://tartarus.org/martin/PorterStemmer/
https://www.cnblogs.com/huiyang865/p/5571421.html
网友评论