美文网首页
3.4-倒排索引入门

3.4-倒排索引入门

作者: 落日彼岸 | 来源:发表于2020-03-16 16:01 被阅读0次

倒排索引的核心组成

  • 倒排索引包含两个部分

    • 单词词典(Term Dictionary), 记录所有文档的单词, 记录单词到倒排索引的关联关系

      • 单词词典一般比较大, 可以通过B+数或哈希拉链法实现,以满足高性能的插入与查询
    • 倒排列表(Posting List) - 记录了单词对应的文档结合, 由倒排索引项组成

      • 倒排索引项(Posting)

        • 文档id

        • 词频TF - 该单词在文档中出现的次数, 用于相关性评分

        • 位置(Posting) - 单词在文档中分词的位置. 用于语句搜索(phrase query)

        • 偏移(Offset) - 记录单词的开始结束位置, 实现高亮显示

ElasticSearch 的倒排索引

  • ElasticSearch的JSON文档中的每个字段, 都有自己的倒排索引

  • 可以指定对某些字段不做索引

    • 优点: 节省存储空间

    • 缺点: 字段无法被搜索

课程DEMO

POST _analyze
{
  "analyzer": "standard",
  "text": "Mastering Elasticsearch"
}

POST _analyze
{
  "analyzer": "standard",
  "text": "Elasticsearch Server"
}

POST _analyze
{
  "analyzer": "standard",
  "text": "Elasticsearch Essentials"
}

相关阅读

相关文章

  • 3.4-倒排索引入门

    倒排索引的核心组成 倒排索引包含两个部分单词词典(Term Dictionary), 记录所有文档的单词, 记录单...

  • Elasticsearch(一):概念与基本API

    安装 Elasticsearch 常用 API index Document 倒排索引与分词 倒排索引 倒排索引与...

  • ElasticSearch(基础)

    1.1 倒排索引 倒排索引原理?? ElasticSearch使用一种称为 ==倒排索引== 的结构,它适用于快...

  • ElasticSearch 倒排索引简析

    内容概要 倒排索引是什么?为什么需要倒排索引? 倒排索引是怎么工作的? 1. 倒排索引是什么? 假设有一个交友网站...

  • 搜索引擎索引-倒排索引

    倒排索引基础 倒排索引示范 Elasticsearch中使用一种称为倒排索引的结构,适用于快速的全文搜索。一个倒排...

  • ElasticSearch知识库

    一、原理篇 Elasticsearch 的倒排索引是什么? 倒排索引=term字典+docId倒排表,term字典...

  • Elasticsearch学习笔记(06) - 倒排索引简介

    Elasticsearch的核心是基于倒排索引。因此,我们有必要了解一下倒排索引算法。 简单的例子 既然有倒排索引...

  • IMI 倒排多索引

    倒排多索引 倒排多索引体现在倒排索引的的时候,使用PQ M=2来代替倒排的K-means,把整个数据集划分为两个子...

  • Elasticsearch之映射与分析

    倒排索引 Elasticsearch 使用一种称为 倒排索引 的结构,它适用于快速的全文搜索。一个倒排索引由文档中...

  • 搜索引擎之倒排索引浅析

    上一篇文章 ElasticSearch 术语中提到了倒排索引,那么这篇文章就来讲解下什么是倒排索引,倒排索引的数据...

网友评论

      本文标题:3.4-倒排索引入门

      本文链接:https://www.haomeiwen.com/subject/alxnehtx.html