solr配置分词器

作者: George_Antonio | 来源:发表于2018-05-21 15:25 被阅读0次

2018-11-09 Solr学习笔记(二)-Solr5.5.5
solr8.3.1配置+IK分词器配置+数据库配置
Solr和中文分词器
solr 安装中文分词器安装和配置
solr安装IK中文分词器
solr4 中文分词配置
solr配置分词器
Solr配置中文分词与数据导入
solr系列2——solr集成IK Analyzer中文分词器
spring boot和solr整合

solrcore中有一个非常重要的配置文件：schema.xml。这里面定义了域以及域的类型。

<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false" />

name：域的名称
type：域的类型
indexed：是否索引
stored：是否存储
required：是否必须
multivalued：是否多值，solr允许一个field存储多个值，比如存储一个用户的好友id（多个）。

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>   
  <analyzer type="query">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

name：域的类型，对应field标签的type
class：域类型的solr类型，如果是TextField，就需要添加分词器
analyzer：分词器配置，index是创建索引时的分词器。query是搜素是使用的分词器，一般情况下是同一个。
tokenizer：指定分词器
filter：指定过滤器

配置IK分词器：

下载路径：https://code.google.com/archive/p/ik-analyzer/downloads

jar包配置：把解压后的jar包（IKAnalyzer2012FF_u1.jar）添加到solr/WEB-INF/lib目录下。

配置文件停用词配置：复制IKAnalyzer的配置文件（IKAnalyzer.cfg.xml）和自定义词典（mydict.dic）和停用词词典（ext_stopword.dic）到solr的solr/WEB-INF/classes目录下。

schema.xml配置：添加自定义的field Type，使用中文分词器。

<!-- IKAnalyzer-->
    <fieldType name="text_ik" class="solr.TextField">
      <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>

索引时配置：在索引时需要在schema.xml中定义Field， field标签下type的属性为text_ik。比如：

<!--IKAnalyzer Field-->
<field name="content_ik" type="text_ik" indexed="true" stored="true" />

重启tomcat就行了。

网友评论

本文标题：solr配置分词器

本文链接：https://www.haomeiwen.com/subject/zyjfjftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

solr配置分词器

配置IK分词器：

相关文章

2018-11-09 Solr学习笔记(二)-Solr5.5.5

solr8.3.1配置+IK分词器配置+数据库配置

Solr和中文分词器

solr 安装中文分词器安装和配置

solr安装IK中文分词器

solr4 中文分词配置

solr配置分词器

Solr配置中文分词与数据导入

solr系列2——solr集成IK Analyzer中文分词器

spring boot和solr整合

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读