一个词性标注器处理一个词序列,为每个词增加一个词性标注(part-of-speech tagger 或者 POS tagger)nltk_text.similar(w)找出w的上下文w1 w w2,然后再根据w1 w2查找和w具有相同的上下文的单词输出。下面是一小段简单的标注程序。
import nltk
text = "I like this fish"
print(nltk.pos_tag(text.split()))
text = "let us go to fish"
print(nltk.pos_tag(text.split()))
tagger | 含义 | tagger | 含义 |
---|---|---|---|
CC | 并列连词 | RB | 副词 |
IN | 介词 | JJ | 形容词 |
网友评论