算分与排序

作者: 滴流乱转的小胖子 | 来源:发表于2020-08-07 06:26 被阅读0次

算分与排序
4.10-综合排序：Function Score Query 优
【elasticsearch】20、function score
归并排序
八种基本排序算法的使用
排序算法
算法
PHP常用算法
算法-选择排序
算法-冒泡排序

⽆法针对相关度，对排序实现更多的控制

Elasticsearch 默认会以⽂档的相关度算分进⾏排序
可以通过指定⼀个或者多个字段进⾏排序
使⽤相关度算分(score)排序，不能满⾜某些特定条件

一、Function Score Query

可以在查询结束后，对每⼀个匹配的⽂档进⾏⼀系列的重新算分，根据新⽣成的分数进⾏排序。

提供了⼏种默认的计算分值的函数

Weight ：为每⼀个⽂档设置⼀个简单⽽不被规范化的权重
Field Value Factor：使⽤该数值来修改 _score，例如将 “热度”和“点赞数”作为算分的参考因素
Random Score：为每⼀个⽤户使⽤⼀个不同的，随机算分结果
衰减函数：以某个字段的值为标准，距离某个值越近，得分越⾼
Script Score：⾃定义脚本完全控制所需逻辑

二、接受欢迎度提升权重 --- Field Value Factor 来举例

希望能够将点赞多的 blog，放在搜索列表相对靠前的位置。同时搜索的评分，还是要作为排序的主要依据

算分逻辑

新的算分 = 老的算分 * 投票数

DELETE blogs
PUT /blogs/_doc/1
{
  "title":   "About popularity",
  "content": "In this post we will talk about...",
  "votes":   0
}

PUT /blogs/_doc/2
{
  "title":   "About popularity",
  "content": "In this post we will talk about...",
  "votes":   100
}

PUT /blogs/_doc/3
{
  "title":   "About popularity",
  "content": "In this post we will talk about...",
  "votes":   1000000
}


POST /blogs/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query":    "popularity",
          "fields": [ "title", "content" ]
        }
      },
      "field_value_factor": {
        "field": "votes"
      }
    }
  }
}

极端情况：

投票数为 0
投票数很大时
算分的结果曲线，波动很大 --- 使用Modifier平滑曲线

POST /blogs/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query":    "popularity",
          "fields": [ "title", "content" ]
        }
      },
      "field_value_factor": {
        "field": "votes",
        "modifier": "log1p"
      }
    }
  }
}

算分逻辑
新的算分 = 老的算分 * log(1 + 投票数)

image.png

三、引入Factor

算分逻辑
新的算分 = 老的算分 * log(1 + factor * 投票数)

image.png

四、Boost Mode 和 Max Boost

Boost Mode

Multiply：算分与函数值的乘积（默认模式）
Sum：算分与函数的和
Min / Max：算分与函数取最⼩ / 最⼤值
Replace：使⽤函数值取代算分

Max Boost 可以将算分控制在⼀个最⼤值

POST /blogs/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query":    "popularity",
          "fields": [ "title", "content" ]
        }
      },
      "field_value_factor": {
        "field": "votes",
        "modifier": "log1p" ,
        "factor": 0.1
      },
      "boost_mode": "sum",
      "max_boost": 3
    }
  }
}

五、一致性随机函数 --- 不以实际存在的字段进行排序，而已用随机数，随机数相同，排序结果相同

使用场景：网站的广告需要提高展现率
具体需求：让每个用户看到不同的随机排名，但是也希望用一个用户访问时，结果的相对顺序，保持一致
(consistently random)

POST /blogs/_search
{
  "query": {
    "function_score": {
      "random_score": {
        "seed": 911119
      }
    }
  }
}

https://www.elastic.co/guide/en/elasticsearch/reference/7.1/query-dsl-function-score-query.html

网友评论

本文标题：算分与排序

本文链接：https://www.haomeiwen.com/subject/hkibrktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

算分与排序

一、Function Score Query

提供了⼏种默认的计算分值的函数

二、接受欢迎度提升权重 --- Field Value Factor 来举例

算分逻辑

极端情况：

三、引入Factor

四、Boost Mode 和 Max Boost

Boost Mode

Max Boost 可以将算分控制在⼀个最⼤值

五、一致性随机函数 --- 不以实际存在的字段进行排序，而已用随机数，随机数相同，排序结果相同

相关文章

算分与排序

4.10-综合排序：Function Score Query 优

【elasticsearch】20、function score

归并排序

八种基本排序算法的使用

排序算法

算法

PHP常用算法

算法-选择排序

算法-冒泡排序

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读