美文网首页
elasticsearch-python-sdk

elasticsearch-python-sdk

作者: mugbya | 来源:发表于2018-05-22 23:05 被阅读83次

    前言

    这里声明: elasticsearch -> es

    漫谈

    我们都知道Python 下 有es的sdk包的,我们也知道java 下有封装更好的es包。为什么说python 下的就封装不好呢? 其实这个也两说,有人就喜欢这样呢

    Python下的es包首先什么都能做,实现功能完全没问题。但是对于 DSL 的话,Python下的es就没有封装了,完全按照es的语法写查询语句。当然这种也是优点,但是如果用了Java下的es 的sdk的话,你会会发现对于DSL 都封装的很好。

    至于封不封装DSL,其实也看业务复不复杂,简单的业务,几行的DSL 直接写也没什么,但是如果很长的呢,比如我这样业务的DSL:

    {
        "size": 1000,
        "query": {
            "bool": {
                "must": [
                    {
                        "term": {
                            "prod_code": {
                                "value": "JDB"
                            }
                        }
                    },
                    {
                        "bool": {
                            "must": [],
                            "must_not": [],
                            "should": [
                                {
                                    "bool": {
                                        "must": [],
                                        "must_not": [],
                                        "should": [
                                            {
                                                "query_string": {
                                                    "default_field": "rp_content",
                                                    "query": "*下了*"
                                                }
                                            },
                                            {
                                                "query_string": {
                                                    "default_field": "rp_content",
                                                    "query": "*下款*"
                                                }
                                            }
                                        ],
                                        "filter": []
                                    }
                                },
                                {
                                    "nested": {
                                        "path": "rp_data",
                                        "query": {
                                            "bool": {
                                                "must": [],
                                                "must_not": [],
                                                "should": [
                                                    {
                                                        "query_string": {
                                                            "default_field": "rp_data.rp_content",
                                                            "query": "*下了*"
                                                        }
                                                    },
                                                    {
                                                        "query_string": {
                                                            "default_field": "rp_data.rp_content",
                                                            "query": "*下款*"
                                                        }
                                                    }
                                                ],
                                                "filter": []
                                            }
                                        }
                                    }
                                }
                            ],
                            "filter": []
                        }
                    }
                ]
            }
        }
    }
    
    

    如果是这样的DSL 直接写在代码中,这个也太长了吧,而且这还不是全部,只是一部分,对于这种动态而且复杂的DSL,直接写,会显得太长。

    故此,我对Python 下的es包进行了增强 —— 对DSL进行封装。项目请点击:# elasticsearch-python

    对于上面DSL 的封装调用结果是这样的:

    
        prod_code = 'JDB'
        key = "下了"
        value = '下了 | 下款'
        bq = bool_query()
        bq.must(term_query('prod_code', prod_code)) \
            .must(bool_query()
                  .should(multi_query_string('rp_content', value))
                  .should(nested_query('rp_data', multi_query_string('rp_data.rp_content', value)))
                  )
    
        print(bq)
        print(QueryBuilders(bq).size(1000))
    

    这下清爽了很多是吧!

    当然这个没写完,对于聚合还没写,而且query也没全部支持,只是把自己用到的给简单封装了下,其实不知道到底有没有人用,没人用自己写再多也就自己玩玩了。这里我的实现也很简单,其实希望有人能有更好的实现。

    相关文章

      网友评论

          本文标题:elasticsearch-python-sdk

          本文链接:https://www.haomeiwen.com/subject/zsfljftx.html