美文网首页
搜索相关性得分

搜索相关性得分

作者: 7赢月 | 来源:发表于2020-04-23 18:45 被阅读0次

介绍

本章将会介绍搜索的相关性得分,通过对不同算法的介绍来介绍es搜索背后的得分计算。


相关性

  • 搜索的相关性算分,描述了一个文档和查询语句匹配的程度。es会对每个查询匹配的结果进行算分
  • 打分的本质是排序,需要把最符合用户搜索预期的结果放在最前面。es5之前采用的相关性算分为TF-IDF,现在采用BM25

词频

  • Term Frequency:检索词在一篇文档中出现评率
    -- 检索词出现的次数除以文档包含的总字数
  • 度量一条查询和结果文档相关性的简单方法:将搜索中的每一个词的TF进行相加就行了
  • Stop World
    -- 对于文档中出现的the,is等词,适当的予以过滤

逆文档频率IDF

  • DF:检索词在所有文档中出现的频率
  • Inverse Document Frequency:= log(所有文档数/检索词出现过的文档总数)
  • TF-IDF本质上是将TF求和变成加权求和

TF-IDF

  • 公式


    Lucene打分公式
  • TF-IDF是被公认的信息检索领域最重要的发明
  • 除了在信息检索领域,在文献分类,和其他相关领域也有着非常广泛的应用
  • 现代搜索引擎对TF-IDF进行了大量使用和优化

BM25

  • 从ES5之后,默认算法改为BM 25
  • 和经典的TF-IDF相比,当TF无线增加时,BM25并不会像TF-IDF无线增大
BM25和TF-IDF对比图

总结

本章通过介绍词频和逆文档频率,来介绍了ES的两种相关性得分,BM25和TF-IDF,其中BM25为ES5之后使用;TF-IDF为ES5之前的相关性算分。

相关文章

  • 搜索相关性得分

    介绍 本章将会介绍搜索的相关性得分,通过对不同算法的介绍来介绍es搜索背后的得分计算。 相关性 搜索的相关性算分,...

  • 如何巧用素材,提高Facebook广告相关性得分?

    一、“相关性得分”是什么? Facebook广告的相关性得分代表广告与覆盖人群产生共鸣的程度,广告的相关性得分越高...

  • Elasticsearch之排序与相关性

    排序 为了按照相关性来排序,需要将相关性表示为一个数值。在 Elasticsearch 中, 相关性得分 由一个浮...

  • 如何靠自己开好阿里淘宝店铺?(4)

    搜索排序系列--产品相关性(基础的排序因子) 一、什么是产品的相关性 通过搜索词和产品因素来匹配出搜索结果 【案例...

  • 4.3-搜索的相关性算分

    相关性和相关性算分 相关性 – Relevance搜索的相关性算分,描述了⼀个⽂档和查询语句匹配的程度。ES 会对...

  • BM25介绍和代码实现

    一、基础介绍 BM25 是一种用来评价搜索词和文档之间相关性的算法。通常用来做搜索相关性评分的,也是ES(弹性搜索...

  • 【elasticsearch】14、搜索相关性算分

    相关性和相关性算分 相关性 -relevance搜索的相关性算分,描述了一个文档和查询语句匹配的程序。es会对每个...

  • ES-相关性重塑

    定义 相关性搜索 让搜索引擎理解语义 影响召回及排序 举例 - //输入休息、住宿,也可以搜到凯悦 相关性重塑策略...

  • 搜索相关性

    学习极客时间《Elasticsearch 核心技术与实战》课程之后的记录。 搜索是用户和搜索引擎的对话,用户关心的...

  • TF-IDF和BM25

    搜索引擎总是会把相关性高的内容显示在前面,相关性低的内容显示在后面。那么,搜索引擎是如何计算关键字和内容的相关性呢...

网友评论

      本文标题:搜索相关性得分

      本文链接:https://www.haomeiwen.com/subject/hetzihtx.html