Solr中文排序问题/分词搜索问题

作者: Martin_阿锤 | 来源:发表于2018-05-17 11:37 被阅读193次

Solr中文排序问题/分词搜索问题
Solr6.4.2+Ik-analyzer6.3使用
solr8.3.1配置+IK分词器配置+数据库配置
2018-11-09 Solr学习笔记(二)-Solr5.5.5
solr4 中文分词配置
初学solr
solr安装IK中文分词器
Solr中文分词
solr中文分词
solr系列2——solr集成IK Analyzer中文分词器

现象描述

图片.png

如图，搜索全脂奶粉，脱脂奶粉排名却比较靠前

2.问题分析

图片.png

solr中文分词粒度过细（左图为建表索引时的分词，右图为查询时的分词）

3.解决过程
ik分词器对中文分词效果较好，但现在已经停止更新。
公司线上solr版本较低。先下载一个最新的solr(version 7.3.+)到本地跑起来再说。
下载的压缩包解压后，进入到bin目录，solr start成功启动。
在solr_home下新建my_core文件夹，再在其中新建conf和data文件夹，conf下的文件拷贝example文件夹中的
ik分词器：
https://github.com/EugenePig/ik-analyzer-solr5
下载后在该目录mvn clear install(JDK>=1.8)
生成的jar复制到solr_home\server\solr-webapp\webapp\WEB-INF\lib下
配置的schema文件里面添加：

<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" />
</analyzer>
</fieldType>

重启solr，在analysis下可以测试新的分词效果