美文网首页
[lucene] indexing process 索引过程

[lucene] indexing process 索引过程

作者: cdz620 | 来源:发表于2020-03-05 10:18 被阅读0次

indexing process

image

Extracting text and creating the document

将不同的数据转换成Document

Analysis

将Document经由一系列的过滤器,产生token stream

Adding to the index

分析后的token stream以Inverted index 保存。

index segments

三层结构

  • segments_<N>文件,保存每个segments文件的对应引用,N 代表索引改变的次数
    • segments file(_X.<ext>, X: segment’s name, <ext>: 代表什么类型的索引文件,term vectors, stored fields, inverted index) 每个segment 包含多个文件

index segments 管理

  • IndexWriter写索引到index segments, 当document 写数据到directory时会创建新的segment
  • 周期性,IndexWriter会选择segment合并成一个新的segment,避免产生过多的segment
  • 合并:由MergeScheduler调度使用MergePolicy对segment 进行合并

相关文章

  • [lucene] indexing process 索引过程

    indexing process Extracting text and creating the documen...

  • [转]Lucene索引过程分析

    原文链接# Lucene学习总结之四:Lucene索引过程分析(1)、# Lucene索引过程分析(2)、#Lu...

  • Lucene索引讲解

    1、IndexWriter详解 问题1:索引创建过程完成什么事? 分词、存储到反向索引中。 Lucene索引创建A...

  • [转]Lucene的索引文件格式

    原文链接Lucene学习总结之三:Lucene的索引文件格式(1)、Lucene的索引文件格式(2)、Lucene...

  • Lucene的索引文件格式(基于V7_3_0)

    拜读刘超觉先的Lucene学习笔记Lucene学习总结之三:Lucene的索引文件格式(1)、Lucene的索引文...

  • Lucene学习笔记

    概要: 全文检索的原理和基本概念(铺垫) Lucene简介,索引文档和检索文档的过程(主要) Lucene 相似度...

  • ElasticSearch原理

    es的索引搜索是以lucene为底层的,但是lucene是没有实现分布式,lucene提供了核心的索引和搜索引擎,...

  • Lucene 7.4 初体验

    前言 本文的简要内容: Lucene简介 体验Lucene Demo Lucene 核心类介绍 Lucene 索引...

  • [lucene] fields

    Lucene fields 可接受的option 主要有三类: indexing storing term vec...

  • Elasticsearch源码分析-索引分析(二)

    1. 写lucene索引入口 在上篇文章中主要讲述了elasticsearch索引的创建过程,即CreateInd...

网友评论

      本文标题:[lucene] indexing process 索引过程

      本文链接:https://www.haomeiwen.com/subject/vxbdchtx.html