美文网首页
Elasticsearch 搜索

Elasticsearch 搜索

作者: 朝圣的路上 | 来源:发表于2016-11-05 21:36 被阅读390次

这里简单记录一下elasticsearch java api 的调用。
首先,初始化一个client.

public TransportClient initClient() {
      Settings settings = Settings.settingsBuilder().put("cluster.name", cluster)
              .put("client.transport.ignore_cluster_name", false).put("node.client", true)
              .put("client.transport.sniff", true).build();

      TransportClient client = null;
      try {
          client = TransportClient.builder().settings(settings).build()
                  .addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("192.168.0.70"), 9300));
          if (client == null) {
              LOGGER.info("Init Elasticsearch client failed!");
          } else {
              LOGGER.info("Init Elasticsearch client successul!");
          }
      } catch (UnknownHostException e) {
          LOGGER.error("client initlization failed!");
          LOGGER.error(e.toString());
      }

      return client;
  }

初始化client的时候记得加上cluster,这个表示你elasticsearch的cluster,可以在配置文件里面找到,如果你elasticsearch安装了head插件,直接可以在网页上看到。

Paste_Image.png

然后,可以加上你的定制条件进行查询。

res = client.prepareSearch(index).setTypes().setQuery(query).setPostFilter(filter)
                  .setSearchType(SearchType.DFS_QUERY_THEN_FETCH).setFrom(from).setSize(count).setExplain(true)
                  .execute().actionGet();

关于查询可以定制一个 setQuery(QueryBuilder) 和 setPostFilter(filter) 。当然还可以根据需要添加排序,分页等参数。这里主要谈一下query和filter.
query的作用是根据条件创建搜索规则。
postFilter的作用是在搜索的结果的基础上过滤结果。
elasticSearch 2.4 以后没有filter相关概念,所以构建query和filter都用QueryBuilder。简单举几个例子

QueryBuilder query = QueryBuilders.matchAllQuery(); //全部查询
QueryBuilder query = QueryBuilders.queryStringQuery(key);

//filter
QueryBuilder  timeFilter = QueryBuilders.rangeQuery("doc.create_time").from(begin_time).to(end_time);
QueryBuilder  channelFilter = QueryBuilders.termsQuery("doc.channel", channel_list);

elasticsearch提供了boolQuery来代替filter的or, and, not等操作。如果想要把上面的filter关联起来需要用must, mustNot, should等操作。

filter = QueryBuilders.boolQuery().must(timeFilter).must(channelFilter);

must可以理解为and, mustNot可理解为not, 但should不能理解为or,这个对查询的结果相关性有影响。
elasticsearch post filter可以作简单的yes/not过滤,但是无法对复查结果进行过滤,至少我没发现。比如下面这种情况。

  1. 我有两种类型的文档,type =1/2;
  2. 我不要两天以外的type=1的文档;
    QueryBuilder typeFilter = QueryBuilders.termQuery("doc.media_type", 2);
    QueryBuilder timeFilter = QueryBuilders.rangeQuery("doc.create_time").lt(TimeUtil.getDaysBefore(2));

    QueryBuilder wFilters = QueryBuilders.boolQuery().must(typeFilter).must(timeFilter);

    filter = QueryBuilders.boolQuery().mustNot(wChatFilters);

这种是没办法做到的,这样只会过滤掉所有type=2的文档以及所有两天以外的文档。
继续探索。。。

相关文章

网友评论

      本文标题:Elasticsearch 搜索

      本文链接:https://www.haomeiwen.com/subject/dmsguttx.html