美文网首页
63、内核原理探秘_倒排索引组成结构以及其索引不可变原因

63、内核原理探秘_倒排索引组成结构以及其索引不可变原因

作者: 拉提娜的爸爸 | 来源:发表于2020-01-10 15:28 被阅读0次

倒排索引,是适合用于进行搜索的

1、倒排索引的结构

(1)包含这个关键词的document list
(2)包含这个关键词的所有document的数量:IDF(inverse document frequency)
(3)这个关键词在每个document中出现的次数:TF(term frequency)
(4)这个关键词在这个document中的次序
(5)每个document的长度:length norm
(6)包含这个关键词的所有document的平均长度

2、倒排索引不可变的好处

(1)不需要锁,提升并发能力,避免锁的问题
(2)数据不变,一直保存在os cache中,只要cache内存足够
(3)filter cache一直驻留在内存,因为数据不变
(4)可以压缩,节省cpu和io开销

3、倒排索引不可变的坏处

每次都要重新构建整个索引

相关文章

网友评论

      本文标题:63、内核原理探秘_倒排索引组成结构以及其索引不可变原因

      本文链接:https://www.haomeiwen.com/subject/crtmactx.html