solr系列2——solr集成IK Analyzer中文分词器

solr系列2——solr集成IK Analyzer中文分词器

作者: 逐暗者 | 来源:发表于2016-04-26 16:44 被阅读0次

solr系列2——solr集成IK Analyzer中文分词器
solr安装IK中文分词器
Solr配置中文分词与数据导入
2018-11-09 Solr学习笔记(二)-Solr5.5.5
Solr6.4.2+Ik-analyzer6.3使用
Solr和中文分词器
solr8.3.1配置+IK分词器配置+数据库配置
elasticsearch之八分词器
Solr IK Analyzer安装
spring boot和solr整合

solr 中文分词器 IK Analyzer整合

下载 IK Analyzer2012ff_hf1.zip分词包
解压
将IKAnalyzer2012FF_u1.jar拷贝到/usr/local/tomcat/webapps/solr/WEB-INF/lib/下
在/usr/local/tomcat/webapps/solr/WEB-INF/下创建classes文件夹

mkdir classes
将前面解压的分词包中的IKAnalyzer.cfg.xml和stopword.dic拷贝到classes中
修改/usr/local/solr/example/solr/collection1/conf/schema.xml文件，添加中文分词器
vim /usr/local/solr/example/solr/collection1/conf/schema.xml
添加如下配置：
<fieldType name="text_ik" class="solr.TextField">

<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
重启tomcat,即可

在IK Analyzer上自定义扩展词库

修改/usr/local/tomcat/webapps/solr/WEB-INF/classes/IKAnalyzer.cfg.xml文件
vim /usr/local/tomcat/webapps/solr/WEB-INF/classes/IKAnalyzer.cfg.xml
添加如下配置：
```
 
 <entry key="ext_dict">ext.dic;</entry>
```
在 /usr/local/tomcat/webapps/solr/WEB-INF/classes/下新建ext.dic文件，添加自定义分词
cd /usr/local/tomcat/webapps/solr/WEB-INF/classes && touch vim ext.dic
添加分词如下：
```
小明今天
  伟大的日子
  不容易
  暴走模式
```
重启tomcat,即可
同理，如果想禁用分词索引，在/usr/local/tomcat/webapps/solr/WEB-INF/classes下的stopword.dic文件中定义即可，stopword.dic文件默认IK Analyzer已经提供，只需要添加禁用分词就可以了。

使用IK Analyzer对field进行分词索引

只需要在添加对应的field时将type的值设置为text_ik即可
具体配置如下：
vim /usr/local/solr/example/solr/collection1/conf/schema.xml
<field name="id" type="text_ik" indexed="true" stored="true" required="true" multiValued="false" />
<field name="sku" type="text_ik" indexed="true" stored="true" omitNorms="true"/>
<field name="name" type="text_ik" indexed="true" stored="true"/>
<field name="manu" type="text_ik" indexed="true" stored="true" omitNorms="true"/>
<field name="cat" type="text_ik" indexed="true" stored="true" multiValued="true"/>
重启tomcat,即可

建议每次修改文件时把tomcat先关闭，避免不必要出错。

作者：逐暗者 （转载请注明出处）

相关文章

solr系列2——solr集成IK Analyzer中文分词器
solr 中文分词器 IK Analyzer整合下载 IK Analyzer2012ff_hf1.zip分词包 ...
solr安装IK中文分词器
solr默认是不支持中文分词的，这样就需要我们手工配置中文分词器，在这里我们选用IK Analyzer中文分词器。...
Solr配置中文分词与数据导入
IKAnalyzer：IK Analyzer_extraIk分词器修改版注: 原版IkAnalyzer在solr中...
2018-11-09 Solr学习笔记(二)-Solr5.5.5
2018-11-09 Solr5.5.5服务器配置中文分词器 [TOC] 1. Solr配置IK中文分词器 1. ...
Solr6.4.2+Ik-analyzer6.3使用
使用IK分词作为solr中文分词。将Ikik-analyzer-solr-6.3.0.jar【下载链接】放到/U...
Solr和中文分词器
本文只是记录下Solr和IK中文分词器的安装配置。安装Solr 在Apache Solr官网下载相应版本...
solr8.3.1配置+IK分词器配置+数据库配置
参考文献 Solr分词搜索solrj简单查询 solr-8.3.1版本连接MySQL、配置IK分词器 Solr配置...
elasticsearch之八分词器
个人专题目录 1. 中文分词器 IK分词器 1.1 分词器 analyzer 什么是分词器 analyzer 分词...
Solr IK Analyzer安装
Solr安装在/solr/dist位置下找到solr.war，如果没有看看是不是叫solr什么什么.war然后改...
spring boot和solr整合
上周简单的学习了solr的数据导入以及IK分词器的安装，今天学习一下solr的一些基本操作，以及和spring b...

网友评论

本文标题：solr系列2——solr集成IK Analyzer中文分词器

本文链接：https://www.haomeiwen.com/subject/jhoqrttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|solr系列2——solr集成IK Analyzer中文分词器|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！