美文网首页
深入理解Elasticsearch搜索算法

深入理解Elasticsearch搜索算法

作者: 郭子语 | 来源:发表于2018-09-28 14:03 被阅读7次

    废话不多说,理解了搜索相关算法是理解搜索的核心!

    对于TF/IDF

    在一个搜索过程中,通常都是这样的过程

    • 过滤,像boolean查询等,must、must not,先过滤出结果
    • TF/IDF对一个term进行分数计算
    • 利用空间向量模型,多个term算出一个总分数。

    常见的搜索优化方法

    实得分数地方

    • 通过boost改变词条权重
    • 改变查询结构,通过bool嵌套bool的方式,仍然相当于改变了他们的权重
    • positive 和negative机制,比如想搜索包含hello的,但是尽量不包含Word的doc,利用negative查询,并通过negative_boost降低分数
    • constant_score机制,直接对某些词条使用不计算分数,部分地方可以用这个提升速度
      *自定义相关度分数算法function_score,boost_mode决定分数与指定字段的值如何计算,相加还是取最大等等。可以通过modifier让计算的分数更平滑,
      https://blog.csdn.net/wuzhiwei549/article/details/80434603
    • 提升索引权重,如通过indices_boost指定某些索引的权重

    相关文章

      网友评论

          本文标题:深入理解Elasticsearch搜索算法

          本文链接:https://www.haomeiwen.com/subject/jbnuoftx.html