美文网首页ElastichSearchelasticsearchElasticSearch
六十四、Elasticsearch内核原理-再谈倒排索引

六十四、Elasticsearch内核原理-再谈倒排索引

作者: 编程界的小学生 | 来源:发表于2017-07-12 13:53 被阅读138次

1、倒排索引,是适合用于进行搜索的

2、倒排索引的结构
(1)包含这个关键词的document list

(2)包含这个关键词的所有document的数量:IDF(inverse document frequency)

(3)这个关键词在每个document中出现的次数:TF(term frequency)

(4)这个关键词在这个document中的次序

(5)每个document的长度:length norm

(6)包含这个关键词的所有document的平均长度

3、倒排索引不可变的好处

(1)不需要锁,提升并发能力。避免锁的问题

(2)数据不变,一直保存在os cache中,只要cache内存足够

(3)filter cache一直驻留在内存,因为数据不变

(4)可以压缩,节省CPU和IO开销

4、倒排索引不可变的坏处

每次都要重新构建整个索引。

若有兴趣,欢迎来加入群,【Java初学者学习交流群】:458430385,此群有Java开发人员、UI设计人员和前端工程师。有问必答,共同探讨学习,一起进步!
欢迎关注我的微信公众号【Java码农社区】,会定时推送各种干货:


qrcode_for_gh_577b64e73701_258.jpg

相关文章

网友评论

    本文标题:六十四、Elasticsearch内核原理-再谈倒排索引

    本文链接:https://www.haomeiwen.com/subject/fgrbhxtx.html