美文网首页
jave使用corenlp

jave使用corenlp

作者: ltochange | 来源:发表于2021-07-13 08:41 被阅读0次

corenlp斯坦福大学开发的基于java语言的自然语言处理工具,能够为文本多种语言学标注,包括分词,句子边界,词性标注,命名实体识别,数字与时间,句法解析(dependency and constituency parses),指代消解,情感,引用归因,关系。目前支持6种语言:阿拉伯语、汉语、英语、法语、德语和西班牙语。

在这里插入图片描述

一个原始句子,会经过上图一系列的标注处理,产生标注集合。

词性标注:


在这里插入图片描述

命名实体识别:

在这里插入图片描述

依存句法解析:


在这里插入图片描述

指代消解:

在这里插入图片描述
使用流程:
(0)需要java环境,提前安装好JDK,运行jave -version,有结果,即为安装好。
(1)从官网下载并解压 CoreNLP 4.2.2
(2)根据所要处理的语言,下载相应的jar包,放到(1)解压的文件夹下面(以英文为例)
mv /path/to/stanford-corenlp-4.2.2-models-english.jar /path/to/stanford-corenlp-4.2.2

(3)配置环境变量,使得可以直接访问到(1)(2)下载到的依赖包。

export CLASSPATH=$CLASSPATH:/path/to/stanford-corenlp-4.2.2/*

(4)标注原始文本。

java -Xmx5g edu.stanford.nlp.pipeline.StanfordCoreNLP -file input.txt

指定需要标注的类型以及输出的格式xml:

java -mx2g edu.stanford.nlp.pipeline.StanfordCoreNLP -annotators tokenize,ssplit,pos,lemma,ner,parse -ssplit.eolonly -tokenize.whitespace true -file input.txt -outputFormat xml

如果没有配置好环境变量,会报错Error: Could not find or load main class edu.stanford.nlp.pipeline.StanfordCoreNLP 无法访问到jar包

除了配置环境变量的其他解决方法

  1. 进入stanford-corenlp-4.2.2目录下再使用:
cd  stanford-corenlp-4.2.2
java -Xmx5g -cp "*" edu.stanford.nlp.pipeline.StanfordCoreNLP -file input.txt
  1. 或者指定jar包所在的目录:
java -Xmx5g -cp "./stanford-corenlp-4.2.2/*" edu.stanford.nlp.pipeline.StanfordCoreNLP -file input.txt

相关文章

  • jave使用corenlp

    corenlp斯坦福大学开发的基于java语言的自然语言处理工具,能够为文本多种语言学标注,包括分词,句子边界,词...

  • 05 JAVE 监视转码操作

    您可以使用侦听器监视代码转换操作。 JAVE定义了it.sauronsoftware.jave.EncoderPr...

  • 02 JAVE 安装

    为了在Java应用程序中使用JAVE,必须在应用程序CLASSPATH中添加文件jave-1.0.jar。 JAV...

  • Jave Timer 使用

    使用 Java 来调度定时任务时,我们经常会使用 Timer 类搞定。Timer 简单易用,在一些业务场景下用来实...

  • Stanford CoreNLP 简单尝试

    CoreNLP官网地址[https://stanfordnlp.github.io/CoreNLP/downloa...

  • ws.schild.jave.InputFormatExcept

    现场还原:使用jave2做音频格式转换功能的时候,起初我是将远程文件地址封装到URI对象,然后交给jave2去处理...

  • Stanford CoreNLP Python接口处理

    Stanford CoreNLP的源代码是使用Java写的,提供了Server方式进行交互。stanfordcor...

  • JavaCC 学习笔记

    最近尝试使用 corenlp 做数据抽取工作,发现其中使用 JavaCC 进行文本操作。 JavaCC 是一个词法...

  • coreNLP-java使用(中文)

    1. IntelliJ IDEA中建立maven工程 推荐参考 maven工程建立具体过程 2. pom.xml...

  • android 面试题总结

    Jave部分 一、多线程 Join() 线程加入,执行此方法的线程优先使用cpu Yeild() 线程释放...

网友评论

      本文标题:jave使用corenlp

      本文链接:https://www.haomeiwen.com/subject/gmnepltx.html