美文网首页spring boot
ES使用遇到的问题

ES使用遇到的问题

作者: 非典型_程序员 | 来源:发表于2019-07-13 18:16 被阅读0次

最近在做一个微服务项目,项目中基本用Redis和ES替代了Mysql,Mysql更像是一个备份。但是在开发中我遇到了一个ES查询问题——ES的嵌套查询。项目中存在一对多的关系,使用Mysql只要关联查询就行了,但是改用ES之后一直没能直接实现我的需求,最后还是没有解决我的问题,下面就简单梳理一下。因为最近好几个小伙伴问怎么搭梯子,所以最后会附上一个搭建梯子教程。
还是使用spring boot来整合ES,我根据项目的需求自己简单的创建一个项目,一个一对多的查询。
首先创建ES一个document(和Mysql的model基本一样),代码如下:

@Document(indexName = "team_index",type = "team_type", shards = 2, replicas = 1,createIndex = false)
public class TeamType {
    
    @Id
    @Field(type = FieldType.Keyword, store = true)
    private String id;

    @Field(type = FieldType.Keyword, store = true)
    private Long teamId;

    @Field(type = FieldType.Nested, store = true)
    private List<MemberType> memberTypes;

    @Field(type = FieldType.Keyword, store = true)
    private String skuCode;

    @Field(type = FieldType.Keyword, store = true)
    private String ownerId;

    @Field(type = FieldType.Keyword, store = true)
    private String status;

    @Field(type = FieldType.Integer, store = true)
    private Integer needAmount;
    // 省略部分字段
    ......
}

// MemberType
public class MemberType {

    @Id
    @Field(type = FieldType.Keyword, store = true)
    private String id;
    
    @Field(type = FieldType.Keyword, store = true)
    private String teamId;

    @Field(type = FieldType.Keyword, store = true)
    private String userId;

    @Field(type = FieldType.Boolean, store = true)
    private boolean captain;

    @Field(type = FieldType.Keyword, store = true)
    private String orderId;
    // 省略部分字段
    ......
}

根据代码就可以看出在TeamType内嵌套了一个MemberType列表,这是一个很简单的一对多的关系。现在我的需求是这样的我需要先对TeamType进行一次过滤查询出满足条件的对象,然后还需要对TeamType内部的MemberType也进行一个过滤。

1、创建索引,添加数据

首先我启动ES和kibana,然后通过调用接口方式创建索引并做好映射关系,当然也可以通过直接操作ES完成,不过既然是项目中使用我觉得自己写个接口调用一下更方便一点,首先是创建索引:

    public Map<String, Object> addIndex() {
        Map<String,Object> resultMap = new HashMap<>();

        if (elasticsearchTemplate.indexExists("team_index")) {
            elasticsearchTemplate.deleteIndex("team_index");
        }
        elasticsearchTemplate.createIndex("team_index");
        elasticsearchTemplate.putMapping(TeamType.class);
        elasticsearchTemplate.refresh(TeamType.class);

        resultMap.put("success",true);
        resultMap.put("message","创建索引成功");
        return resultMap;
    }

接下来就是将数据从数据库的数据存放到ES。在数据库中我的Team和Member是分表存放的,二者通过Team的主键进行关联。而在ES中只有TeamType一个类型,所以查询从数据库查询出数据后需要自己拼装一下。因为整个业务很简单,封装这一点也比较简单,先从数据库查询所有Team,然后遍历查询所有的Member即可(或者使用之前说过的Mybatis一对多查询),代码如下:

    public void addDataToES() {
        List<Team> teamList = teamRepository.findAll();

        for(Team team : teamList) {
            List<Member> memberList = memberRepository.queryAllByTeamId(team.getId());
            List<MemberType> memberTypeList = toTypeList(memberList);

            TeamType teamType = new TeamType(team,memberTypeList);
            teamTypeRepository.save(teamType);
            teamTypeRepository.refresh();
        }
    }

现在索引建了、数据也存放了,接下来就是查询

2、使用ES查询

首先通过使用kibana来查询,看下ES中的数据是否完整,

GET team_index/_search
{
  "query": {
    "match_all": {}
  }
}

因为数据比较少,所以就贴提下查询的结果:

{
  "took": 62,
  "timed_out": false,
  "_shards": {
    "total": 5,
    "successful": 5,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 1,
    "hits": [
      {
        "_index": "team_index",
        "_type": "team_type",
        "_id": "2",
        "_score": 1,
        "_source": {
          "id": "2",
          "teamId": 2,
          "memberTypes": [
            {
              "id": "5",
              "teamId": "2",
              "userId": "U22222222",
              "captain": false,
              "orderId": "O888888888",
              "createTime": "2019-07-09T05:18:00.303+0000",
              "updateTime": "2019-07-09T05:18:09.365+0000"
            },
            {
              "id": "4",
              "teamId": "2",
              "userId": "U11111111",
              "captain": false,
              "orderId": "O999999999",
              "createTime": "2019-07-09T05:17:34.585+0000",
              "updateTime": "2019-07-09T05:17:46.820+0000"
            }
          ],
          "skuCode": "8887545454514",
          "ownerId": "U00000001",
          "status": "success",
          "needAmount": 6,
          "createTime": "2019-07-09T05:18:56.112+0000",
          "updateTime": "2019-07-09T05:19:16.234+0000"
        }
      },
      {
        "_index": "team_index",
        "_type": "team_type",
        "_id": "1",
        "_score": 1,
        "_source": {
          "id": "1",
          "teamId": 1,
          "memberTypes": [
            {
              "id": "3",
              "teamId": "1",
              "userId": "U77777777",
              "captain": true,
              "orderId": "O333333333",
              "createTime": "2019-07-09T05:17:15.285+0000",
              "updateTime": "2019-07-09T05:17:25.145+0000"
            },
            {
              "id": "2",
              "teamId": "1",
              "userId": "U88888888",
              "captain": false,
              "orderId": "O222222222",
              "createTime": "2019-07-09T05:16:45.362+0000",
              "updateTime": "2019-07-09T05:16:57.684+0000"
            },
            {
              "id": "1",
              "teamId": "1",
              "userId": "U99999999",
              "captain": false,
              "orderId": "O111111111",
              "createTime": "2019-07-09T05:16:21.608+0000",
              "updateTime": "2019-07-09T05:16:32.736+0000"
            }
          ],
          "skuCode": "9944545412121",
          "ownerId": "U55555555",
          "status": "success",
          "needAmount": 10,
          "createTime": "2019-07-09T05:18:27.576+0000",
          "updateTime": "2019-07-09T05:18:50.830+0000"
        }
      }
    ]
  }
}

查询结果出来是2个TeamType,现在需求是这样的:先对TeamType进行一个过滤,然后对其内部嵌套的MemberType再进行一个过滤。以上面的查询结果为例,我要查询"status"等于"success",然后内部的MemberType的"captain"属性为false。也就是说我期望的结果如下:

{
    "hits": {
        "total": 2,
        "max_score": 1,
        "hits": [
            {
                "_index": "team_index",
                "_type": "team_type",
                "_id": "2",
                "_score": 1,
                "_source": {
                    "id": "2",
                    "teamId": 2,
                    "memberTypes": [
                        {
                            "id": "5",
                            "teamId": "2",
                            "userId": "U22222222",
                            "captain": false,
                            "orderId": "O888888888",
                            "createTime": "2019-07-09T05:18:00.303+0000",
                            "updateTime": "2019-07-09T05:18:09.365+0000"
                        },
                        {
                            "id": "4",
                            "teamId": "2",
                            "userId": "U11111111",
                            "captain": false,
                            "orderId": "O999999999",
                            "createTime": "2019-07-09T05:17:34.585+0000",
                            "updateTime": "2019-07-09T05:17:46.820+0000"
                        }
                    ],
                    "skuCode": "8887545454514",
                    "ownerId": "U00000001",
                    "status": "success",
                    "needAmount": 6,
                    "createTime": "2019-07-09T05:18:56.112+0000",
                    "updateTime": "2019-07-09T05:19:16.234+0000"
                }
            },
            {
                "_index": "team_index",
                "_type": "team_type",
                "_id": "1",
                "_score": 1,
                "_source": {
                    "id": "1",
                    "teamId": 1,
                    "memberTypes": [
                        {
                            "id": "2",
                            "teamId": "1",
                            "userId": "U88888888",
                            "captain": false,
                            "orderId": "O222222222",
                            "createTime": "2019-07-09T05:16:45.362+0000",
                            "updateTime": "2019-07-09T05:16:57.684+0000"
                        },
                        {
                            "id": "1",
                            "teamId": "1",
                            "userId": "U99999999",
                            "captain": false,
                            "orderId": "O111111111",
                            "createTime": "2019-07-09T05:16:21.608+0000",
                            "updateTime": "2019-07-09T05:16:32.736+0000"
                        }
                    ],
                    "skuCode": "9944545412121",
                    "ownerId": "U55555555",
                    "status": "success",
                    "needAmount": 10,
                    "createTime": "2019-07-09T05:18:27.576+0000",
                    "updateTime": "2019-07-09T05:18:50.830+0000"
                }
            }
        ]
    }
}

按照原有想法,先过滤"status"为"success"的,然后内部去过滤"memberTypes.captain"为false。但是实际使用并不是这么回事,我使用嵌套查询尝试了一下,但是没有得到期望的结果,查询如下:

GET team_index/_search

{
  "query": {
    "bool": {
      "must": [
        {"match": {
          "status": "success"
        }},
        {
          "nested": {
            "path": "memberTypes",
            "query": {
              "match": {
                "memberTypes.captain": false
              }
            }
          }
        }
      ]
    }
  }
}

使用这个查询出来的结果和不使用嵌套查询结果是一样的,当然也可能是因为我数据量少的原因。但是嵌套查询条件确实没有生效,查询结果中依然有"captain"为true的数据。不知道是不是我的思路有问题,如果有了解ES的可以告知一下,网上找了很久也没有找到合适的方法。如果根据结果来推导,会不会是这么一个逻辑,嵌套查询查找"captain"为false的TeamType,也就是说只要TeamType中的memberTypes有一个满足"captain"为false,那么就会将这个TeamType返回,而返回的结果是不过滤内部的MemberType的。为此我又专门添加了一条TeamType数据,并将其内部的MemberType的"captain"全部设置成true,然后再次查询,发现查询的结果依然是全部数据,也就是说嵌套的"captain"为false条件没有生效,所以我的猜想是错的。
目前完全进入了死胡同,感觉这么简单的查询,自己却没有办法解决。最后对查询的结果在代码里面对其进行筛选,不过这个方法感觉有点low。 代码如下:

    public Map<String, Object> queryMembers(Integer teamId) {
        Map<String,Object> resultMap = new HashMap<>();

        NestedQueryBuilder nestedQueryBuilder =
                new NestedQueryBuilder("memberTypes",termQuery("memberTypes.captain",false),ScoreMode.None);

        BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery()
                .must(termQuery("teamId",teamId)).must(nestedQueryBuilder);

        SearchQuery searchQuery = new NativeSearchQueryBuilder()
                .withIndices("team_index")
                .withTypes("team_type")
                .withQuery(boolQueryBuilder)
                .build();

        List<TeamType> teamTypeList = new ArrayList<>();
        Iterable<TeamType> teamTypes = teamTypeRepository.search(searchQuery);
        Iterator<TeamType> iterator = teamTypes.iterator();
        while (iterator.hasNext()) {
            TeamType teamType = iterator.next();
            List<MemberType> memberTypeList = teamType.getMemberTypes();

            teamType.setMemberTypes(memberTypeList.stream().filter(m -> !m.isCaptain()).collect(Collectors.toList()));
            teamTypeList.add(teamType);
        }

        resultMap.put("result",teamTypeList);

        return resultMap;
    }

不知道是不是自己使用查询的姿势不正确,但是不管是在java代码还是在kibana里面操作,都无法得到自己想要的结果,最后只能在代码中多结果再次进行一次过滤。官方文档中的说明也不是很清楚,自己看着感觉疑问挺多的。自己网上找了一些嵌套查询的例子,但是都只给查询的DSL,并没有返回相应的结果。
自己也不知道怎么解决了,问了几个同事也都没有解决,如果哪位小伙伴对这个问题比较熟悉,希望指点一下,自己现在也不知道到底问题处在哪里了。


另外有好几个小伙伴问我自建梯子的问题,因为我现在用的GCP服务器在海外(以前在日本,现在我迁到印度了),所以如果自建梯子必须要有海外的服务器,网上有如何薅羊毛的教程,一般都是一年或者送一定金额,具体可以网上百度一下。比如AWS、GCP,但是AWS速度比较慢,GCP的话目前好像国内没法注册了。你也可以自己买一个小型机,一月好像5刀左右吧。我将搭梯子的教程放到github,我以前在简书发过一次AWS的,但是被官方给锁定了,所以就和这次的项目代码放我的github了,有需要的可以自取。公众号如果不能打开github链接,建议到简书查看链接。

相关文章

  • ES使用遇到的问题

    最近在做一个微服务项目,项目中基本用Redis和ES替代了Mysql,Mysql更像是一个备份。但是在开发中我遇到...

  • ElasticSearch使用总结(三)

    在Es的使用过程中,会遇到许多的坑,在这里总结下我所遇到的一些问题和解决方法。 Es重建索引Es的索引不像mysq...

  • Windows Docker-Desktop启动ElasticS

    在Windows的Docker desktop下使用ES,通常会遇到内存不足的问题。 我使用WSL作为后端,调整的...

  • 如何在WebStorm中Debug Node + ES6代码

    在使用ES6写后端代码时我遇到一个问题就是如何debug我的ES6代码。�由于现在Node对ES6的所有特性支持的...

  • 问题总结

    背景:在项目中,使用 CDP/HBase/ES/Neo4j 所遇到的问题总结 问题背景原因解决方案建议CDP数据骤...

  • 玩ES遇到的问题

    1-1、问题:ERROR: bootstrap checks failed max file descriptor...

  • ES6

    先学 ES 5 还是 ES 6无聊的问题 ES 6 如何学快速通览,然后使用边使用边加深印象自学的问题你不知道一个...

  • ES-Spark连接ES后,ES Client节点流量打满分析

    问题描述 前段时间用es-spark读取es数遇到了client节点流量打满的现象。es-spark配置的es.n...

  • es安装时遇到的问题

    9200端口被限制为本机访问。 在elasticsearch.yml文件中增加: network.bind_hos...

  • OpenGL ES之旅(三)-- OpenGL ES 纹理翻转解

    纹理翻转概述 在使用OpenGL ES函数加载纹理到图形时,经常遇到纹理上下颠倒的问题。原因是因为OpenGL E...

网友评论

    本文标题:ES使用遇到的问题

    本文链接:https://www.haomeiwen.com/subject/fitukctx.html