美文网首页
elasticsearch-DSL高级查询语法整理

elasticsearch-DSL高级查询语法整理

作者: weylau | 来源:发表于2020-01-01 16:32 被阅读0次

    DSL语句查询

    查询字符串搜索便于通过命令行完成特定(ad hoc)的搜索,但是它也有局限性(参阅简单搜索章节)。Elasticsearch提供丰富且灵活的查询语言叫做DSL查询(Query DSL),它允许你构建更加复杂、强大的查询。
    DSL(Domain Specific Language特定领域语言)以JSON请求体的形式出现

    一、query context

    主要特点:

    • 是否包含

    确定文档是否应该成为结果的一部分

    • 相关度得分多少

    除了确定文档是否匹配外,查询子句还计算了表示文档与其他文档相比匹配程度的_score

    • 得分越高,相关度越高

    更相关的文件,在搜索排名更高

    应用场景:

    • 全文检索——这种相关性的概念非常适合全文搜索,因为很少有完全“正确”的答案

    文本查询语法:

    match-模糊匹配:如 搜索"四大名著" 会查出包含 "四大" OR "名著" OR "四大名著"的记录

    GET /megacorp/employee/_search
    {
       "query" : {
           "match" : {
               "last_name" : "四大名著"
           }
       }
    }
    

    match_phrase-短语匹配:如 搜索"四大名著" 不会查出包含 "四大" OR "名著" 只会查出包含 "四大名著"的记录

    GET /megacorp/employee/_search
    {
       "query" : {
           "match_phrase" : {
               "last_name" : "四大名著"
           }
       }
    }
    

    multi_match-多字段匹配:如 搜索"孙悟空" 只要first_name或者about字段中包含 "孙悟空" OR "孙"等分词都会被查找出来;

    GET /megacorp/employee/_search
    {
         "query": {
              "multi_match": {
                   "query": "孙悟空",
                   "fields":["first_name","about"]
              }
         }
    }
    

    query_string-lucene查询语法查询(kibana查询语法)

    GET /megacorp/employee/_search
    {
         "query": {
              "query_string": {
                   "query": "孙悟空 OR 张三"
              }
         }
    }
    

    query_string-多字段

    GET /megacorp/employee/_search
    {
         "query": {
              "query_string": {
                    "fields":["about","last_name"],
                   "query": "孙悟空 OR 张三"
              }
         }
    }
    

    高亮搜索

    GET /megacorp/employee/_search
    {
       "query" : {
           "match_phrase" : {
               "about" : "西游记"
           }
       },
       "highlight": {
           "fields" : {
               "about" : {}
           }
       }
    }
    

    结构查询语法:

    term-将按照存储在倒排索引中的确切字词进行操作,这些查询通常用于数字,日期和枚举等结构化数据,而不是全文本字段。 或者,它们允许您制作低级查询,并在分析过程之前进行

    GET /megacorp/employee/_search
    {
         "query": {
              "term": {
                    "age":"33"
              }
         }
    }
    

    range范围查询-如查询age大于等于20小于等于30的记录

    GET /megacorp/employee/_search
    {
         "query": {
              "range": {
                    "age":{
                        "gte":20,
                        "lte":30
                    }
              }
         }
    }
    

    二、fiter context

    主要特点:

    • 是否包含

    确定是否包含在检索结果中,回答只有“是”或“否”,精确搜索

    • 不涉及评分

    在搜索中没有额外的相关度排名

    • 针对结构化数据

    适用于完全精确匹配,范围检索

    • 更快

    只确定是否包括结果中,不需要考虑得分。
    为什么会更快?——经常使用的过滤器将被Elasticsearch自动缓存,以提高性能。

    查询语法:

    bool关键字

    GET /megacorp/employee/_search
    {
         "query": {
              "bool": {
                    "filter":{
                        "term":{
                            "age":33
                        }
                    }
              }
         }
    }
    

    复合查询

    constant_score-将查询内部的结果文档得分都设定为1或者boost的值,多用于结合bool查询实现自定义得分

    GET /megacorp/employee/_search
    {
         "query": {
              "constant_score": {
                    "filter":{
                        "match":{
                            "about":"张三"
                        }
                    }
              }
         }
    }
    

    自定义分数

    GET /megacorp/employee/_search
    {
         "query": {
              "constant_score": {
                    "filter":{
                        "match":{
                            "about":"张三"
                        }
                    }
              },
              "boots":2
         }
    }
    

    should-至少满足一个条件

    GET /megacorp/employee/_search
    {
        "query": {
            "bool": {
                "should": [
                    {
                        "match": {
                            "first_name": "孙悟空"
                        }
                    },
                    {
                        "match": {
                            "last_name": "张三"
                        }
                    }
                ]
            }
        }
    }
    

    must-必须同时满足所有条件

    GET /megacorp/employee/_search
    {
        "query": {
            "bool": {
                "must": [
                    {
                        "match": {
                            "first_name": "孙悟空"
                        }
                    },
                    {
                        "match": {
                            "about": "四大名著"
                        }
                    }
                ]
            }
        }
    }
    

    must_not-必须不满足条件 如:查不等于33岁的记录

    GET /megacorp/employee/_search
    {
        "query": {
            "bool": {
                "must_not": 
                    {
                        "term": {
                            "age": "33"
                        }
                    }
            }
        }
    }
    

    组合查询

    GET /megacorp/employee/_search 
    {
        "query": {
            "bool": {
                "must": [
                    {
                        "match": {
                            "first_name": "孙悟空"
                        }
                    },
                    {
                        "match": {
                            "about": "四大名著"
                        }
                    }
                ],
                "filter":{
                    "term":{
                        "age":35
                    }
                }
            }
        }
    }
    

    聚合查询GROUP BY

    //根据年龄字段分组
    GET /megacorp/employee/_search
    {
     "aggs": {
       "group_by_age": {
         "terms": { "field": "age" }
       }
     }
    }
    
    //根据条件分组
    GET /megacorp/employee/_search
    {
     "query": {
       "match": {
         "last_name": "孙悟空"
       }
     },
     "aggs": {
       "group_by_age": {
         "terms": { "field": "age" }
       }
     }
    }
    
    //分组并求平均值
    GET /megacorp/employee/_search
    {
     "aggs": {
       "group_by_age": {
         "terms": { "field": "age" },
         "aggs" : {
                   "avg_age" : {
                       "avg" : { "field" : "age" }
                   }
               }
       }
     }
    }
    

    相关文章

      网友评论

          本文标题:elasticsearch-DSL高级查询语法整理

          本文链接:https://www.haomeiwen.com/subject/vccgoctx.html