美文网首页ELK stack
ElasticSearch配置中文分词ik

ElasticSearch配置中文分词ik

作者: 朱株 | 来源:发表于2016-04-14 11:13 被阅读4084次

ElasticSearch 有一些自带的分词,如smartcn。这次是安装了ik的中文分词,其他的等待研究.

网上帖子很多,可能是因为版本问题,但是安装的时候还是遇到了不少坑,因此记录下来,便于后面人参考。

ElasticSearch 版本2.3.1;ik 版本 1.9.1

【1】 下载对应的IK版本

https://github.com/medcl/elasticsearch-analysis-ik

【2】编译elasticsearch-analysis-ik

有git的可以采用命令行下载

git clonehttps://github.com/medcl/elasticsearch-analysis-ik.git--depth=1

#没有git的,就直接在网站上点击下载即可。

#需要安装Maven,因为是pom的项目

#如果没有安装maven,执行 sudo apt-get install maven

Maven命令行编译  

cd elasticsearch-analysis-ik

maven package  elasticsearch-analysis-ik

#或者导入到eclipse工程中Maven 编译也可以

【3】配置

(1)maven package执行完毕后会在当前目录下生成target/releases目录,将其中的elasticsearch-analysis-ik-1.2.9.zip。拷贝到elasticsearch目录下的新建的目录plugins/analysis-ik,并解压。

(2)拷贝辞典.将analysis-ik目录下的config/ik 拷贝到elasticsearch的config目录。

(3)修改elasticsearch的配置文件,指定IK为分词工具。打开config/elasticsearch.yml,在最后添加index.analysis.analyzer.ik.type : "ik"

【4】校验

重启elasticsearch,查看启动是否正常。

浏览器上输入http://localhost:9200/_analyze?analyzer=ik&pretty=true&text=我是中国人

看到对比结果就说明IK安装成功啦。

继续研究。。。。。

PS:

1)下载的时候要使用版本匹配的ik

2)有很多帖子说直接可以用命令行安装,如下plugin install medcl/elasticsearch-analysis-ik,但是发现一堆报错,报各种配置找不到。我对比了下smartcn,elasticsearch-analysis-ik网站上下载的是源码,而smartcn已经是编译后的jar和配置了。@medcl 大侠,如果能提供编译好后的文件下载就更好啦

相关文章

网友评论

    本文标题:ElasticSearch配置中文分词ik

    本文链接:https://www.haomeiwen.com/subject/mpeglttx.html