一、相关概念:
1、相关性:
确切地说,应该加限定词,应该称作,已匹配到的内容的相关性。通俗地讲,就是已匹配到的内容跟要搜索的词(或句子)像不像。其中,已匹配到的内容,是指那些匹配了部分的搜索词的内容,或者完全和搜索词一模一样,这样就算匹配。而这个“像不像”,有一模一样,9分像,3分像的区别,而这个到底有多像,就是相关性。相关性评分是一个用数字量化的值,值越高,表示相关性越强,和要搜索的内容越接近。
二、计算:
Elasticsearch 的相关性评分用一个正浮点数字段 _score 来表示。_score 的评分越高,相关性越高。查询语句会为每个文档生成一个 _score 字段用以表示相关性,默认按降序排序。ES早期版本使用的算法是:检索词频率/反向文档频率(即:TF/IDF算法),ES5.0以后使用的算法变成了BM25算法,是TF与IDF的乘积。根据不同的查询条件以及查询条件不同的组合方式,每个查询条件经过BM25算法得到的值会再经过不同的运算最终得到 _score相关性评分。
网友评论