美文网首页
ES倒排索引

ES倒排索引

作者: 鸿雁长飞光不度 | 来源:发表于2020-02-01 01:12 被阅读0次

1.核心组成

  • 单词词典(Term Dictionry)
    记录所有的文档单词,记录单词到倒排列表的关联关系。一般比较大,可以通过B+树或者哈希拉链法实现,满足高性能的查询和插入。
  • 倒排列表(Posting List)
    记录了单词对应的文档的集合,由倒排索引项构成 。
    • 倒排索引项
      • 文档id
      • 词频TF:该单词在文档中出现的次数,用于关联性打分。
      • 位置:单词在文档中分词的位置,用于语句搜索。
      • 偏移:记录单词的开始结束位,实现高亮显示。

案例

原内容:

文档ID 文档内容
1 Mastering Elasticsearch
2 Elasticsearch Server
3 Elasticsearch Example

假设单词字典只有一个单词Elasticsearch,对应的倒排列表如下:

docId(文档id) TF(词频) Position(位置) Offset(偏移量)
1 1 1 (10,23)
2 1 0 (0,13)
3 1 0 (0,13)

2.ES里面的倒排索引

  • ES里面的JSON文档的每个字段,都有自己的倒排索引。
  • 可以指定某些字段不做索引。
    • 优点:节省空间
    • 缺点:字段无法被搜索

相关文章

  • ES

    ES 三大操作: 构建索引、检索数据、聚合数据 ES 特性: 分布式、倒排索引、近实时、相似精度 适用场景: 倒排...

  • ES倒排索引

    1.核心组成 单词词典(Term Dictionry)记录所有的文档单词,记录单词到倒排列表的关联关系。一般比较大...

  • Elasticsearch中ik分词器的使用

    1.ES分词简介 Elasticsearch是基于倒排索引来实现搜索功能,而倒排索引的基础就是分词。因此分词对于学...

  • es概念

    文档地址:https://es.xiaoleilu.com/ 倒排索引 对比: 正排索引 文档id到文档内容和...

  • elasticsearch head 日常操作

    前言 elasticsearch 下文简称es,本文基于es6所书写。 es作为非关系型数据库,基于倒排索引,集群...

  • Elasticsearch精学笔记(一)

    一、理解ES数据层和倒排索引: 一个 Elasticsearch 集群可以包含多个索引,相应的每个索引可以包含多个...

  • es原理--两篇文章

    infoQ讲解倒排索引 博客园讲解压缩原理,以及es搜索原理

  • Elasticsearch-基础使用

    零、本文纲要 一、认识Elasticsearch二、倒排索引三、ES的部分概念四、安装ES、Kibana、分词器五...

  • Elasticsearch(一):概念与基本API

    安装 Elasticsearch 常用 API index Document 倒排索引与分词 倒排索引 倒排索引与...

  • es (7.7.1)与springboot整合

    使用es的原因 es 基于内存的倒排索引算法,能够快速进行数据的索引 使用场景 1、本人在测试中实现了(vue) ...

网友评论

      本文标题:ES倒排索引

      本文链接:https://www.haomeiwen.com/subject/nwygthtx.html