ES 搜索算法

ES 搜索算法

作者: Ary_zz | 来源:发表于2020-02-28 21:01 被阅读0次

Elasticsearch SQL全文搜索 --- 2022-0
ES 搜索算法
算法-二分搜索算法
DFS（深度优先搜索）和BFS(广度优先搜索)
数据结构与算法--BFS&DFS
广度优先搜索算法(BFS)
深度优先搜索算法(DFS)
二分查找算法递归实现
优化算法笔记（九）杜鹃搜索算法
A*算法和最佳优先搜索算法（Best-First-Searc

2020-02-28

布尔模型

在查询中使用 AND 、 OR 和 NOT

TF/IDF

tf(t in d) = √frequency

词 t 在文档 d 的词频（ tf ）是该词在文档中出现次数的平方根。

将参数 index_options 设置为 docs 可以禁用词频统计及词频位置，这个映射的字段不会计算词的出现次数，对于短语或近似查询也不可用。要求精确查询的 not_analyzed 字符串字段会默认使用该设置。

idf(t) = 1 + log ( numDocs / (docFreq + 1))

词 t 的逆向文档频率（ idf ）是：索引中文档数量除以所有包含该词的文档数，然后求其对数。

字段长度归一值

norm(d) = 1 / √numTerms

norm是字段中词数平方根的倒数

举例

example

vector space model

when search 'happy hippopotamus':

// of course 'hippopotamus' weighs more
happy hippopotamus => [2,5] (weight vectors)

then calculated in indices:

Document 1: (happy,____________)—[2,0]
Document 2: ( ___ ,hippopotamus)—[0,5]
Document 3: (happy,hippopotamus)—[2,5]

It appears that doc 3 is the most relevant one.

image.png

相关文章

Elasticsearch SQL全文搜索 --- 2022-0
ES SQL语法虽然支持like语句，但是like并不是使用全文搜索算法，ES SQL语句中主要通过MATCH函数...
ES 搜索算法
2020-02-28 布尔模型在查询中使用 AND 、 OR 和 NOT TF/IDF 词 t 在文档 d 的词...
算法-二分搜索算法
算法：二分搜索算法（折半查找算法）时间复杂度：二分搜索算法概述二分搜索算法伪代码二分搜索算法实现二分搜索算...
DFS（深度优先搜索）和BFS(广度优先搜索)
深度优先搜索算法（Depth-First-Search）深度优先搜索算法（Depth-First-Search），...
数据结构与算法--BFS&DFS
“搜索”算法深度优先搜索算法和广度优先搜索算法都是基于“图”这种数据结构。图上的搜索算法就是，在图中找出从一个...
广度优先搜索算法(BFS)
广度优先搜索算法(BFS) 标签（空格分隔）： algorithm 1.广度优先搜索算法(Breadth Firs...
深度优先搜索算法(DFS)
深度优先搜索算法(BFS) 标签（空格分隔）： algorithm 1.深度优先搜索算法(Breath Fisrt...
二分查找算法递归实现
引自Wikipedia 折半搜索算法
优化算法笔记（九）杜鹃搜索算法
1. 杜鹃搜索算法简介（以下描述，均不是学术用语，仅供大家快乐的阅读）杜鹃搜索算法（Cuckoo search，...
A*算法和最佳优先搜索算法（Best-First-Searc
BFS算法算法原理最佳优先搜索算法是一种启发式搜索算法（Heuristic Algorithm），其基于广度优...

网友评论

本文标题：ES 搜索算法

本文链接：https://www.haomeiwen.com/subject/ngvrhhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|ES 搜索算法|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！