美文网首页
索引构建

索引构建

作者: 似水流年_yt | 来源:发表于2018-06-23 19:41 被阅读0次

创建索引

首先在solr目录下建立一个名字为test的core,后面的-force是因为是root账户创建的core,所以要加的,而这个core在solr的./solr-7.3.1/example/techproducts/solr/test目录下。

bin/solr create -c test -force 

test索引目录如下,conf文件夹主要是修改配置文件,主要配置和修改里面的managed-schema和solrconfig.xml,data文件夹下的index就是我们上传的数据和索引都在里面,而剩下的两个,其中lib文件夹里面是mmseg4j的压缩包,dic文件夹就是mmseg4j分词包的一些词库,有常用词词库、停用词词库等。

目录结构

配置schema,schema里面的每个field定义一个元数据,而这些数据都是根据之前的元数据描述的excel表格来的,来确定他的名字,类型,是否索引,储存,多值等。

schema

因为要对在搜索框中所输入的词进行处理,所以要加载中文分词包进行分词,首先加载mmseg4j分词包,通过fieldtype来定义几个字段类型,有textComple、textMaxWord、textSimpe,后面再tokenizer就是调用分词包,mode是分词类型,有完全分词和简单分词等,在之后就是调用分词包的路径。不过因为在solr-7.3.1版本里面,如果被索引的字段是多值的,那么他的分词效果就会出现一些问题,所以对于要被索引的字段类型中是多值的,要用其他分词包,后面我就直接用了solr自带的分词包,在./solr7.3.1/example/techproduct/solr/text/conf下的solrconfig.xml中添加如下语句,加载smartcn包,这dir里面的就是smartcn在solr的路径。

mmseg4j smartcn

在之后就是通过solr浏览器界面里的docments导入数据,直接把整理好的json数据往里面灌,数据文件有两个,一个是view.json,另一个是bytravel.json。

docment案例 json文件 view.json bytravel.json

把上面的步骤完成之后,就可以在浏览器界面端,通过用solr的query来进行一下基础的查询,看看搭建的索引能不能用,可以进行各种测试,在之后进入刚刚搭建的索引的browse界面,可以进行一些基本的自然语言查询,结果如下图所示

query查询 browse界面

相关文章

  • 索引构建

    1 索引构建 索引构建 建立倒排索引的过程,就是索引构建 索引器 构建索引的程序或者计算机,就是索引器 索引器需要...

  • cocoapods私有库笔记

    构建私有库 索引库:存放索引地方私有库:存放代码地方 1.构建索引库 1.1 构建Cocoapods管理 1.1....

  • day08-存储引擎

    一、回顾 1.1 索引 (1) 聚集索引构建B树的过程 (2) 辅助索引构建B树的过程 (3) 辅助索引细分 单列...

  • RNA-seq:STAR 软件比对(SLURM递交系统)

    索引构建 构建好索引后,第一次比对 未完待续

  • day08(上周复习+存储引擎下)

    1、上周复习 1.1、索引 1.1.1、聚集索引构建B树的过程 1.1.2、辅助索引构建B树的过程 1.1.3、面...

  • Day07-SQL存储引擎

    上节回顾 1. 聚集索引与辅助索引的区别?(面试题) 聚集索引构建B树过程(面试题) 辅助索引构建B树过程(面试题...

  • 索引构建

    创建索引 首先在solr目录下建立一个名字为test的core,后面的-force是因为是root账户创建的cor...

  • IDEA文件查找功能Enter file name失效

    索引丢失 需要重现构建项目索引。操作方法如下:

  • Day08-锁、隔离级别

    上节知识回顾 1. 索引(详细回答) 聚集索引构建B树详细过程 辅助索引构建B树详细过程 2. 面试简易回答 请简...

  • hisat2的使用

    利用hisat2 构建索引

网友评论

      本文标题:索引构建

      本文链接:https://www.haomeiwen.com/subject/ygddyftx.html