倒排索引

作者: 还有下文 | 来源:发表于2019-05-06 22:30 被阅读4次

由来

正向索引: 文档-->单词

如果使用正向索引, 当用户搜索 关键词 A 时, 需要扫描索引库中的所有文档,
找出所有包含 A 的文档, 然后根据打分模型进行打分, 排出名次后 呈现给用户。

这样做,无法满足实时返回结果给用户的 需求。

倒排索引: “关键词” --> 带有此关键词的 文档ID列表

详细

实现 “单词--文档矩阵”的一种具体存储形式。

示例

文档.png 倒排索引库.png

参数解释:
单词ID: 记录每个单词的单词编号
单词: 对应的单词
文档频率: 代表文档集合中有多少个文档包含某个单词
倒排列表:包含单词ID及其他必要信息
DocId:单词出现的文档id
TF:单词在某个文档中出现的次数
POS:单词在文档中出现的位置

举例:
以单词“拉斯”为例,其单词编号为8,文档频率为2,代表整个文档集合中有两个文档包含这个单词,对应的倒排列表为:{(3;1;<4>),(5;1;<4>)},其含义为在文档3和文档5出现过这个单词,单词频率都为1,单词“拉斯”在两个文档中的出现位置都是4,即文档中第四个单词是“拉斯”。

参考

https://www.cnblogs.com/zlslch/p/6440114.html

相关文章

  • Elasticsearch(一):概念与基本API

    安装 Elasticsearch 常用 API index Document 倒排索引与分词 倒排索引 倒排索引与...

  • ElasticSearch(基础)

    1.1 倒排索引 倒排索引原理?? ElasticSearch使用一种称为 ==倒排索引== 的结构,它适用于快...

  • ElasticSearch 倒排索引简析

    内容概要 倒排索引是什么?为什么需要倒排索引? 倒排索引是怎么工作的? 1. 倒排索引是什么? 假设有一个交友网站...

  • 搜索引擎索引-倒排索引

    倒排索引基础 倒排索引示范 Elasticsearch中使用一种称为倒排索引的结构,适用于快速的全文搜索。一个倒排...

  • ElasticSearch知识库

    一、原理篇 Elasticsearch 的倒排索引是什么? 倒排索引=term字典+docId倒排表,term字典...

  • Elasticsearch学习笔记(06) - 倒排索引简介

    Elasticsearch的核心是基于倒排索引。因此,我们有必要了解一下倒排索引算法。 简单的例子 既然有倒排索引...

  • IMI 倒排多索引

    倒排多索引 倒排多索引体现在倒排索引的的时候,使用PQ M=2来代替倒排的K-means,把整个数据集划分为两个子...

  • Elasticsearch之映射与分析

    倒排索引 Elasticsearch 使用一种称为 倒排索引 的结构,它适用于快速的全文搜索。一个倒排索引由文档中...

  • 搜索引擎之倒排索引浅析

    上一篇文章 ElasticSearch 术语中提到了倒排索引,那么这篇文章就来讲解下什么是倒排索引,倒排索引的数据...

  • ElasticSearch第5节 倒排索引、分词器

    一、倒排索引 Elasticsearch使用一种称为倒排索引的结构,它适用于快速的全文捜索.一个倒排索引由文档中所...

网友评论

    本文标题:倒排索引

    本文链接:https://www.haomeiwen.com/subject/nzpjoqtx.html