美文网首页
Solr配置中文分词与数据导入

Solr配置中文分词与数据导入

作者: 我不说你不懂_f0c6 | 来源:发表于2018-03-24 15:26 被阅读0次

IKAnalyzer:IK Analyzer_extraIk分词器修改版注: 原版IkAnalyzer在solr中的schame.xml中配置后无法开启最大粒度分词。

二.IKAnalyzer配置

solr的配置安装solr配置

IKAnalyzer下载后解压,把IKAnalyzer.cfg.xml、stopword.dic拷贝E:\dev\solr_tomcat\collection1\conf下面,把IKAnalyzer2012FF_u1.jar拷贝到E:\dev\apache-tomcat-7.0.59\webapps\solr\WEB-INF\lib下面。
导入分词需要的文件到solr下


image.png

修改solr_tomcat\solr\collection1\conf下的schema.xml文件,添加代码:

<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="true"/> </analyzer> <analyzer type="query"> <tokenizer class="org.apache.lucene.analysis.ik.IKTokenizerFactory" useSmart="false"/> </analyzer> </fieldType>

image.png image.png

数据批量导入操作步骤:


image.png image.png
添加代码:
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <lst name="defaults"> <str name="config">data-config.xml</str> </lst> </requestHandler>
image.png image.png

查询:


image.png

相关文章

网友评论

      本文标题:Solr配置中文分词与数据导入

      本文链接:https://www.haomeiwen.com/subject/svbqcftx.html