solr7.4配置core创建及分词配置

solr7.4配置core创建及分词配置

作者: 非小惰 | 来源:发表于2018-08-02 18:00 被阅读0次

solr7.4配置core创建及分词配置
core dump
Postgres全文索引
solr5.5配置ik中文分词器
kubeadm（四）——安装ingress-nginx
Solr高级_Master/Slave
分词器
ES - 中文分词及高亮搜索
开发速记-emacs篇: java+gradle开发模式
solr8.3.1配置+IK分词器配置+数据库配置

1、solr配置

首先我使用的是solr7.4所以下载解压后无需进行tomcat关联，直接在解压目录下solr-7.4.0/bin/solr start 就可以运行，也可进入到bin目录使用./solr start 进行运行，solr默认端口为8983，如需要自定义端口，则在启动是后面加上 -p 如./solr start -p 8888,启动后，在浏览器中输入http://localhost:8983/solr即可跳转到solr控制台页面

2、创建Core

solr以文件的方式将数据存储在core下，接下来我们就创建自己的core，点击控制台左边的Core admin

点击Add Core

core home的路径的查看我们稍后再聊，点击Add Core，我们认为会在core home路径下，创建了一个名为coreTest的文件夹并完成core的创建，然而

上方红色报错信息中指出的/Users/edz/Documents/ide/solr/solr-7.4.0/server/solr/ 即为core home路径，可以用如下方式查看

我们进入到core home中

发现仅仅是创建了coreTest文件夹，core并未成功创建，因为我们缺少solrconfig.xml,将solr-7.4.0/server/solr/configsets/_default/下的conf文件夹，复制到新建的core目录下,即coreTest，再次点击Add Core

创建成功，点击左侧Core Selector选择新添加的coreForCheck

添加自定义key

看到了存储类型，就要开始讲一下分词了，讲分词之前我们先看一下field type的类别，

他的这些类别实际上是在配置文件中，配置文件路径如下 solr home/coreTest(上面创建core时的instanceDir路口)/conf/managed-schema 我们打开看一下

下拉列表中的类型都是在此文件中配置的，solr默认添加了英文的分词，但是没有中文分词，这意味在此文件中并无英文分词的filed type，如果我们要进行分词，需进行如下操作

3、分词配置

下载ik分词的jar包，

链接: https://pan.baidu.com/s/116BEGAB0HXMtIei8SViyqw 密码: d3hy

将jar包复制到路径solr-7.4.0/server/solr-webapp/webapp/WEB-INF/lib下，在上文提到的配置文件managed-schema中添加中文分词的field类别

<fieldType name="worddata_ik" class="solr.TextField">

<analyzer type="index">

<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" conf="ik.conf" useSmart="false"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

<analyzer type="query">

<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" conf="ik.conf" useSmart="true"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

</fieldType>

添加solr自带的中文分词

将solr-7.4.0\contrib\analysis-extras\lucene-libs中的lucene-analyzers-smartcn-7.4.0.jar 复制到

solr-7.4.0/server/solr-webapp/webapp/WEB-INF/lib下，在配置文件managed-schema中添加中文分词的field类别

<fieldType name="worddata_smart" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index">

<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> </analyzer>

<analyzer type="query">

<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> </analyzer>

</fieldType>

重启solr, bin/solr restart -force

再次进行添加

为方便比较，再建一个field

再添加一个使用自带分词

进行分词校验

结果如下

无中文分词的字段

ik分词

自带分词

上述为基本solr操作，下一步研究添加自定义分词词汇😁

相关文章

solr7.4配置core创建及分词配置
1、solr配置首先我使用的是solr7.4所以下载解压后无需进行tomcat关联，直接在解压目录下so...
core dump
参考: Core dump 打开及配置 Core Linux文档示例: 打开配置生效查看
Postgres全文索引
Postgres 分词插件安装脚本创建全文索引配置使用方式
solr5.5配置ik中文分词器
启动命令: 进入管理界面http://localhost:8983/solr/#/ 配置core先创建core文件...
kubeadm（四）——安装ingress-nginx
CentOS Linux release 7.6.1810 (Core) 一、创建ingress基础配置和Pod ...
Solr高级_Master/Slave
Core的创建删除是不能同步，只能同步Core中的数据配置主节点：
分词器
日语单个句子分词整个文件分词 mecab参数配置mecab安装很棒的总结（日文）mecab配置文件中文 ...
ES - 中文分词及高亮搜索
包括内容: IK分词组件的添加和配置索引建立及高亮搜索示例添加自定义分词的测试版本: ES - 2.4.5,...
开发速记-emacs篇: java+gradle开发模式
安装nix并配置channel: 安装gradle及lombok: 安装emacs: 配置emacs: 创建并拷贝...
solr8.3.1配置+IK分词器配置+数据库配置
参考文献 Solr分词搜索solrj简单查询 solr-8.3.1版本连接MySQL、配置IK分词器 Solr配置...

网友评论

程序员

本文标题：solr7.4配置core创建及分词配置

本文链接：https://www.haomeiwen.com/subject/jccsvftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

程序员

关于我们|服务条款|联系我们|solr7.4配置core创建及分词配置|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！