美文网首页BATJ架构
了解Elasticsearch 的相关性评分

了解Elasticsearch 的相关性评分

作者: 裘马轻狂大帅 | 来源:发表于2020-06-18 20:49 被阅读0次

一、相关概念:

    1、相关性:

      确切地说,应该加限定词,应该称作,已匹配到的内容的相关性。通俗地讲,就是已匹配到的内容跟要搜索的词(或句子)像不像。其中,已匹配到的内容,是指那些匹配了部分的搜索词的内容,或者完全和搜索词一模一样,这样就算匹配。而这个“像不像”,有一模一样,9分像,3分像的区别,而这个到底有多像,就是相关性。相关性评分是一个用数字量化的值,值越高,表示相关性越强,和要搜索的内容越接近。

二、计算:

      Elasticsearch 的相关性评分用一个正浮点数字段 _score 来表示。_score 的评分越高,相关性越高。查询语句会为每个文档生成一个 _score 字段用以表示相关性,默认按降序排序。ES早期版本使用的算法是:检索词频率/反向文档频率(即:TF/IDF算法),ES5.0以后使用的算法变成了BM25算法,是TF与IDF的乘积。根据不同的查询条件以及查询条件不同的组合方式,每个查询条件经过BM25算法得到的值会再经过不同的运算最终得到 _score相关性评分。

相关文章

网友评论

    本文标题:了解Elasticsearch 的相关性评分

    本文链接:https://www.haomeiwen.com/subject/vsjpxktx.html