美文网首页
Elasticsearch实战 使用相关性进行搜索

Elasticsearch实战 使用相关性进行搜索

作者: 二次元日系控铲屎官 | 来源:发表于2019-03-18 10:40 被阅读0次

    一、Elasticsearch的打分机制

    Elasticsearch使用了被搜索词条的频率以及他有多常见来影响得分。简单的解释是,一个词条出现在某个文档中的次数越多,它就越相关,但是如果该词条出现在不同文档的次数越多,它就越不想关。这一点被成为TF-IDF。TF=term frequency,IDF=iverse document frequency

    Lucene评分公式

    给定查询q和文档d,其得分是查询中每个词条t的得分总和,而每个词条的纷纷是该词在文档d中的词频的平方根,乘以该词逆文档频率的平方和,乘以该文档字段的归一化因子,乘以该词的提升权重

    综上所属,词条的词频越高,得分越高;相似的,索引中词条越罕见,逆文档频率越高。

    相关文章

      网友评论

          本文标题:Elasticsearch实战 使用相关性进行搜索

          本文链接:https://www.haomeiwen.com/subject/ceplmqtx.html