美文网首页
NLTK之词性(POS)标注

NLTK之词性(POS)标注

作者: writ | 来源:发表于2019-04-29 11:43 被阅读0次

词性(POS),目前最先进的词性标注算法在预测给定单词的词性上已经有了较高的精确度(约97%),但词性标注领域中仍有大量的研究等着我们。
POS标记器


image.png

调用word_tokenize

import nltk
from nltk import word_tokenize
s = "I was watching TV"
print(nltk.pos_tag(word_tokenize(s)))
#[('I','PRP'),('was','VBD'),('watching','VBG'),('TV','NN')]

Stanford标注器

from nltk.tag.stanford import POSTagger
import nltk
stan_tagger = POSTagger()
tokens = nltk.word_tokenize(s)
stan_tagger.tag(tokens)

顺序性标注器

N-gram标注器
正则表达式标注器

Brill标注器

基于机器学习的标注器

最大熵分类器(MEC),隐性马尔可夫模型(HMM),条件随机场(CRF)

命名实体识别(NER)

NER标注器

import nltk
from nltk import ne_chunk
sent = "Mark is studing"
print(ne_chunk(nltk.pos_tag(word_tokenize(sent)),binary=False))

Stanford NER标注器

from nltk.tag.stanford import NERTagger
st = NERTagger()
st.tag('Rami Eid is studying at Stony Brook University in NY'.split())

相关文章

  • NLTK之词性(POS)标注

    词性(POS),目前最先进的词性标注算法在预测给定单词的词性上已经有了较高的精确度(约97%),但词性标注领域中仍...

  • nltk词性标注中的词性

    nltk是一个高效的python构建的平台,用来处理人类自然语言数据。它提供了易于使用的接口,通过这些接口可以访问...

  • 自然语言处理——7.7 词性标注概述

    面临的问题 词性(part-of-speech, POS)标注(tagging)的主要任务是消除词性兼类歧义。在任...

  • 使用词性标注器

    一个词性标注器处理一个词序列,为每个词增加一个词性标注(part-of-speech tagger 或者 POS ...

  • NLTK中文词性自动标注

    1. 说明  学习自然语言处理,一定会参考NLTK,主要是学习它的思路, 从设计地角度看看能做什么. 其...

  • NLTK(二):英文词性标注

    简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。 将一个句子或者一个段落输入到 NLTK...

  • RNN(2)词性标注POS

    简介 本篇文章用于将英文句子转换为其对应的词性标注,结构如下图所示: 预处理 数据获取 数据来源于NLTK这个NL...

  • NLTK手动下载语料

    NLTK是一个非常流行的NLP开源工具包,可以实现分词、词性标注、命名实体识别等基本的文本处理操作。在使用NLTK...

  • NLTK文本预处理与文本分析

    本文主要介绍Python中NLTK文本分析的内容,咱先来看看文本分析的整个流程: 原始文本 - 分词 - 词性标注...

  • 自然语言处理(NLP)系列-第一节:第三方库比较

    简要介绍: ·NLTK(Python自然语言工具包)用于诸如标记化、词形还原、词干化、解析、POS标注等任务。该库...

网友评论

      本文标题:NLTK之词性(POS)标注

      本文链接:https://www.haomeiwen.com/subject/tzbenqtx.html