美文网首页
4.10-综合排序:Function Score Query 优

4.10-综合排序:Function Score Query 优

作者: 落日彼岸 | 来源:发表于2020-04-03 15:35 被阅读0次

算分与排序

  • Elasticsearch 默认会以⽂档的相关度算分进⾏排序

  • 可以通过指定⼀个或者多个字段进⾏排序

  • 使⽤相关度算分(score)排序,不能满⾜某些特定条件

  • ⽆法针对相关度,对排序实现更多的控制

Function Score Query

  • Function Score Query

    • 可以在查询结束后,对每⼀个匹配的⽂档进⾏⼀系列的重新算分,根据新⽣成的分数进⾏排序。
  • 提供了⼏种默认的计算分值的函数

    • Weight :为每⼀个⽂档设置⼀个简单⽽不被规范化的权重

    • Field Value Factor:使⽤该数值来修改 _score,例如将 “热度”和“点赞数”作为算分的参考因素

    • Random Score:为每⼀个⽤户使⽤⼀个不同的,随机算分结果

    • 衰减函数: 以某个字段的值为标准,距离某个值越近,得分越⾼

    • Script Score:⾃定义脚本完全控制所需逻辑

按受欢迎度提升权重

  • 希望能够将点赞多的 blog,放在搜索列表相 对靠前的位置。同时搜索的评分,还是要作为排序的主要依据

  • 新的算分 = ⽼的算分 * 投票数

    • 投票数 为 0

    • 投票数很⼤时

POST /blogs/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query":    "popularity",
          "fields": [ "title", "content" ]
        }
      },
      "field_value_factor": {
        "field": "votes"
      }
    }
  }
}

使⽤ Modifier 平滑曲线

  • 新的算分 = ⽼的算分 * log( 1 + 投票数 )


    image.png
Modifier

引⼊ Factor

  • 新的算分 = ⽼的算分 * log( 1 + factor *投票数 )
Factor

Boost Mode 和 Max Boost

  • Boost Mode

    • Multiply:算分与函数值的乘积

    • Sum:算分与函数的和

    • Min / Max:算分与函数取 最⼩/ 最⼤值

    • Replace:使⽤函数值取代算分

  • Max Boost 可以将算分控制在⼀个最⼤值

⼀致性随机函数

  • 使⽤场景:⽹站的⼴告需要提⾼展现率

  • 具体需求:让每个⽤户能看到不同的随机排名,但是 也希望同⼀个⽤户访问时,结果的相对顺序,保持⼀致 (Consistently Random)

POST /blogs/_search
{
  "query": {
    "function_score": {
      "random_score": {
        "field": "votes",//7.0开始random_score需要加上field参数,且类型是数字
        "seed": 999
      }
    }
  }
}

本节知识点回顾

  • 复合查询:Function Score Query

  • 提供了多种函数,⾃定义脚本,完全控制算分

  • Field Value Factor:搜索的相关度,能够结合投票的数量进⾏重算。通过⼀些参数的设 定,对算分进⾏控制

  • 随机函数:⽤户提供 Seed,返回⼀个随机⼀致性的排序结果

课程Demo

DELETE blogs
PUT /blogs/_doc/1
{
  "title":   "About popularity",
  "content": "In this post we will talk about...",
  "votes":   0
}

PUT /blogs/_doc/2
{
  "title":   "About popularity",
  "content": "In this post we will talk about...",
  "votes":   100
}

PUT /blogs/_doc/3
{
  "title":   "About popularity",
  "content": "In this post we will talk about...",
  "votes":   1000000
}


POST /blogs/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query":    "popularity",
          "fields": [ "title", "content" ]
        }
      },
      "field_value_factor": {
        "field": "votes"
      }
    }
  }
}

POST /blogs/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query":    "popularity",
          "fields": [ "title", "content" ]
        }
      },
      "field_value_factor": {
        "field": "votes",
        "modifier": "log1p"
      }
    }
  }
}


POST /blogs/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query":    "popularity",
          "fields": [ "title", "content" ]
        }
      },
      "field_value_factor": {
        "field": "votes",
        "modifier": "log1p" ,
        "factor": 0.1
      }
    }
  }
}


POST /blogs/_search
{
  "query": {
    "function_score": {
      "query": {
        "multi_match": {
          "query":    "popularity",
          "fields": [ "title", "content" ]
        }
      },
      "field_value_factor": {
        "field": "votes",
        "modifier": "log1p" ,
        "factor": 0.1
      },
      "boost_mode": "sum",
      "max_boost": 3
    }
  }
}

POST /blogs/_search
{
  "query": {
    "function_score": {
      "random_score": {
        "field": "votes",//7.0开始random_score需要加上field参数,且类型是数字
        "seed": 999
      }
    }
  }
}

相关阅读

相关文章

网友评论

      本文标题:4.10-综合排序:Function Score Query 优

      本文链接:https://www.haomeiwen.com/subject/wabhphtx.html