想要更好的处理中文,中文分词插件那是必不可少的。
这里使用的是 ik,也可以考虑其他插件(比如 smartcn,mmseg)。
如果你不想自己一个一个的下载安装那么麻烦,可以考虑:elasticsearch-rtf,只是版本有点低,当前版本 Elasticsearch 5.1.1。
什么是Elasticsearch-RTF?
RTF是Ready To Fly的缩写,在航模里面,表示无需自己组装零件即可直接上手即飞的航空模型,Elasticsearch-RTF是针对中文的一个发行版,即使用最新稳定的elasticsearch版本,并且帮你下载测试好对应的插件,如中文分词插件等,目的是让你可以下载下来就可以直接的使用(虽然es已经很简单了,但是很多新手还是需要去花时间去找配置,中间的过程其实很痛苦),当然等你对这些都熟悉了之后,你完全可以自己去diy了,跟linux的众多发行版是一个意思。
自己安装的话,去github上直接下载zip文件。
→ https://github.com/medcl/elasticsearch-analysis-ik/releases
选择和已经下载的elasticsearch版本兼容的ik。
解压后复制到之前安装的elasticsearch/plugins下,目录结构如下图:
插件 目录结构然后再启动bin/elasticsearch.bat
查看日志:
启动输出看到loaded plugin [analysis-ik] 说明ik分词器这个插件已经启动了。
之前我在插件没启用成功的时候如果创建索引
创建索引就报错了"analyzer [ik_smart] not found for field [title]"
安装成功后就可以成功创建索引了。
网友评论