ES操作纪要

作者: 唐T唐X | 来源:发表于2020-12-22 11:48 被阅读0次

ES操作纪要
ES _bulk 批量操作用法
OpenGL ES手册翻译---2.OpenGL ES操作（一）
ES操作
ES操作
ES
商炜：10.18黄金原油技术分析及操作建议
ES操作（基本操作）
ElasticSearch-5 ES7 RestHighLeve
ElasticSearch-4 ES7 RestHighLeve

我们的ES是5.5版本，所以参考看的文档是这个：https://www.elastic.co/guide/en/elasticsearch/reference/5.5/index.html

1. 创建索引、创建mapping映射、设置分词

PUT tangxue_test_index_20201222
{
    "settings":{
        "index":{
            "number_of_shards":"3",
            "number_of_replicas":0,
            "refresh_interval":"1"
        },
        "analysis":{
            "analyzer":{
                "ngram_analyzer":{
                    "tokenizer":"my_tokenizer"
                },
                "ik_unsmart_analyzer":{
                    "filter":[
                        "lowercase"
                    ],
                    "type":"custom",
                    "tokenizer":"ik_max_word"
                }
            },
            "tokenizer":{
                "my_tokenizer":{
                    "filter":[
                        "lowercase"
                    ],
                    "type":"ngram",
                    "min_gram":1,
                    "max_gram":3,
                    "token_chars":[
                        "letter",
                        "digit"
                    ]
                }
            }
        }
    },
    "mappings":{
        "medicalrecord":{
            "properties":{
                "fullFieldName":{
                    "type":"keyword",
                    "fields":{
                        "ngramFullFieldName":{
                            "type":"text",
                            "analyzer":"ngram_analyzer"
                        },
                        "ikFullFieldName":{
                            "type":"text",
                            "analyzer":"ik_unsmart_analyzer"
                        }
                    }
                }
            }
        }
    }
}

image.png

2. 获取索引数据

GET tangxue_test_index_20201222

获取结果为：

{
  "tangxue_test_index_20201222": {
    "aliases": {},
    "mappings": {
      "medicalrecord": {
        "properties": {
          "fullFieldName": {
            "type": "keyword",
            "fields": {
              "ikFullFieldName": {
                "type": "text",
                "analyzer": "ik_unsmart_analyzer"
              },
              "ngramFullFieldName": {
                "type": "text",
                "analyzer": "ngram_analyzer"
              }
            }
          }
        }
      }
    },
    "settings": {
      "index": {
        "refresh_interval": "-1",
        "number_of_shards": "3",
        "provided_name": "tangxue_test_index_20201222",
        "creation_date": "1608606744812",
        "analysis": {
          "analyzer": {
            "ik_unsmart_analyzer": {
              "filter": [
                "lowercase"
              ],
              "type": "custom",
              "tokenizer": "ik_max_word"
            },
            "ngram_analyzer": {
              "tokenizer": "my_tokenizer"
            }
          },
          "tokenizer": {
            "my_tokenizer": {
              "filter": [
                "lowercase"
              ],
              "token_chars": [
                "letter",
                "digit"
              ],
              "min_gram": "1",
              "type": "ngram",
              "max_gram": "3"
            }
          }
        },
        "number_of_replicas": "0",
        "uuid": "-QzDmvr1RiO4Ce44RKom7A",
        "version": {
          "created": "5050399"
        }
      }
    }
  }
}

3. 创建文档

POST tangxue_test_index_20201222/medicalrecord
{
  "fullFieldName":"姓名"
}
POST tangxue_test_index_20201222/medicalrecord
{
  "fullFieldName":"姓"
}
POST tangxue_test_index_20201222/medicalrecord
{
  "fullFieldName":"名"
}

4. 搜索文档（细写细读，也就是写入和读取用的分词一样）

GET tangxue_test_index_20201222/_search
{
  "query" : {
    "bool" : {
      "should" : [
        {
          "match": {
            "fullFieldName.ngramFullFieldName": "姓名"
          }
        }
      ],
      "disable_coord" : false,
      "adjust_pure_negative" : true,
      "boost" : 1.0
    }
  }
}

返回结果：

{
  "took": 1,
  "timed_out": false,
  "_shards": {
    "total": 3,
    "successful": 3,
    "failed": 0
  },
  "hits": {
    "total": 7,
    "max_score": 4.9663877,
    "hits": [
      {
        "_index": "tangxue_test_index_20201222",
        "_type": "medicalrecord",
        "_id": "AXaIjKHEsDP0SDHXyJsa",
        "_score": 4.9663877,
        "_source": {
          "fullFieldName": "姓名"
        }
      },
      {
        "_index": "tangxue_test_index_20201222",
        "_type": "medicalrecord",
        "_id": "AXaIlF0xsDP0SDHXyJse",
        "_score": 1.5325457,
        "_source": {
          "fullFieldName": "名"
        }
      },
      {
        "_index": "tangxue_test_index_20201222",
        "_type": "medicalrecord",
        "_id": "AXaIlCH-sDP0SDHXyJsd",
        "_score": 0.44839138,
        "_source": {
          "fullFieldName": "姓"
        }
      }
      }
    ]
  }
}

5. 修改_settings

POST tangxue_test_index_20201222/_close

PUT tangxue_test_index_20201222/_settings
{
  "analysis":{
      "analyzer":{
          "ngram_analyzer":{
              "tokenizer":"my_tokenizer"
          },
          "ik_unsmart_analyzer":{
              "filter":[
                  "lowercase"
              ],
              "type":"custom",
              "tokenizer":"ik_max_word"
          }
      },
      "tokenizer":{
          "my_tokenizer":{
              "filter":[
                  "lowercase"
              ],
              "type":"ngram",
              "min_gram":2,
              "max_gram":3,
              "token_chars":[
                  "letter",
                  "digit"
              ]
          }
      }
  }
}

POST tangxue_test_index_20201222/_open

6.增加Mappings实现细写粗读

一般情况，索引分词（写）应该按照最细力度分词，搜索分词（读）可按照最粗力度分词，即所谓的细写粗读

修改Settings

PUT tangxue_test_index_20201222/_settings
{
  "analysis":{
      "analyzer":{
          "ngram_analyzer1":{
              "tokenizer":"my_tokenizer1"
          },
          "ngram_analyzer2":{
              "tokenizer":"my_tokenizer2"
          },
          "ik_unsmart_analyzer":{
              "filter":[
                  "lowercase"
              ],
              "type":"custom",
              "tokenizer":"ik_max_word"
          }
      },
      "tokenizer":{
          "my_tokenizer1":{
              "filter":[
                  "lowercase"
              ],
              "type":"ngram",
              "min_gram":1,
              "max_gram":3,
              "token_chars":[
                  "letter",
                  "digit"
              ]
          },
          "my_tokenizer2":{
              "filter":[
                  "lowercase"
              ],
              "type":"ngram",
              "min_gram":2,
              "max_gram":3,
              "token_chars":[
                  "letter",
                  "digit"
              ]
          }
      }
  }
}

增加Mappings

PUT tangxue_test_index_20201222/_mapping/medicalrecord?update_all_types
{
  "properties": {
    "fullFieldName":{
        "type":"keyword",
        "fields":{
            "ngramFullFieldName_new":{
                "type":"text",
                "analyzer":"ngram_analyzer1",
                "search_analyzer":"ngram_analyzer2"
            }
        }
    }
  }
}

写入数据

POST tangxue_test_index_20201222/medicalrecord
{
  "fullFieldName":"姓名"
}
POST tangxue_test_index_20201222/medicalrecord
{
  "fullFieldName":"姓"
}
POST tangxue_test_index_20201222/medicalrecord
{
  "fullFieldName":"姓名tang"
}

读取数据，注意要用新的mapping字段ngramFullFieldName_new

GET tangxue_test_index_20201222/_search
{
  "query" : {
    "bool" : {
      "should" : [
        {
          "match": {
            "fullFieldName.ngramFullFieldName_new": "姓名"
          }
        }
      ],
      "disable_coord" : false,
      "adjust_pure_negative" : true,
      "boost" : 1.0
    }
  }
}

读取结果，会发现返回结果是没有单独“姓”这个返回的

{
  "took": 1,
  "timed_out": false,
  "_shards": {
    "total": 3,
    "successful": 3,
    "failed": 0
  },
  "hits": {
    "total": 2,
    "max_score": 0.49191087,
    "hits": [
      {
        "_index": "tangxue_test_index_20201222",
        "_type": "medicalrecord",
        "_id": "AXaI8FkysDP0SDHXyJsp",
        "_score": 0.49191087,
        "_source": {
          "fullFieldName": "姓名"
        }
      },
      {
        "_index": "tangxue_test_index_20201222",
        "_type": "medicalrecord",
        "_id": "AXaI9ewmsDP0SDHXyJsr",
        "_score": 0.28004453,
        "_source": {
          "fullFieldName": "姓名tang"
        }
      }
    ]
  }
}

7. 查看特定分词器下的分词结果

GET tangxue_test_index_20201222/_analyze
{
  "analyzer":"ngram_analyzer1",
  "text":"姓名美美 ！*1"
}

结果为：

{
  "tokens": [
    {
      "token": "姓",
      "start_offset": 0,
      "end_offset": 1,
      "type": "word",
      "position": 0
    },
    {
      "token": "姓名",
      "start_offset": 0,
      "end_offset": 2,
      "type": "word",
      "position": 1
    },
    {
      "token": "姓名美",
      "start_offset": 0,
      "end_offset": 3,
      "type": "word",
      "position": 2
    },
    {
      "token": "名",
      "start_offset": 1,
      "end_offset": 2,
      "type": "word",
      "position": 3
    },
    {
      "token": "名美",
      "start_offset": 1,
      "end_offset": 3,
      "type": "word",
      "position": 4
    },
    {
      "token": "名美美",
      "start_offset": 1,
      "end_offset": 4,
      "type": "word",
      "position": 5
    },
    {
      "token": "美",
      "start_offset": 2,
      "end_offset": 3,
      "type": "word",
      "position": 6
    },
    {
      "token": "美美",
      "start_offset": 2,
      "end_offset": 4,
      "type": "word",
      "position": 7
    },
    {
      "token": "美",
      "start_offset": 3,
      "end_offset": 4,
      "type": "word",
      "position": 8
    },
    {
      "token": "1",
      "start_offset": 7,
      "end_offset": 8,
      "type": "word",
      "position": 9
    }
  ]
}

8. 查看所有索引详细数据

GET /_cat/indices?v

9. 查看某一个数据的信息（举例比如通过字段 “_id” 获取）

GET tangxue_test_index_20201222/_search
{
  "query": {
    "term": {
      "_id": {
        "value": "AXapehbzsDP0SDHXyJyz"
      }
    }
  }
}

结果为：

{
  "took": 1,
  "timed_out": false,
  "_shards": {
    "total": 3,
    "successful": 3,
    "failed": 0
  },
  "hits": {
    "total": 1,
    "max_score": 1,
    "hits": [
      {
        "_index": "tangxue_test_index_20201222",
        "_type": "medicalrecord",
        "_id": "AXapehbzsDP0SDHXyJyz",
        "_score": 1,
        "_source": {
          "fullFieldName": "美美姓名思"
        }
      }
    ]
  }
}

10. 清除ES某个索引的缓存

POST /tangxue_test_index_20201222/_cache/clear

ES操作纪要
我们的ES是5.5版本，所以参考看的文档是这个：https://www.elastic.co/guide/en/e...
ES _bulk 批量操作用法
es版本：7.6 es 的 bulk 操作，是用来批量发送请求，或者理解为批量操作的。支持4种操作 bulk 支...
OpenGL ES手册翻译---2.OpenGL ES操作（一）
OpenGL ES 操作 2.1 OpenGL ES的基础框架 OpenGL ES（后面简称为“GL”），只关心数...
ES操作
查询有哪些索引创建索引关闭和打开索引在处理elasticsearch的时候，通常需要不断地调整索引的配置，以期...
ES操作
从文章只供个人学习参考使用！！ 1、创建索引 2、给索引起别名一个别名可以对应多个索引，一个索引也可以对应多个别...
ES
简单介绍了ES、Kibana和Go语言操作ES。 Elasticsearch 介绍 Elasticsearch（E...
商炜：10.18黄金原油技术分析及操作建议
商炜：10.18黄金原油技术分析及操作建议【国际要闻】昨晚美联储会议纪要公布，纪要显示，每一位决策者都支持美联...
ES操作（基本操作）
1.创建索引返回值： 2.插入一条数据返回值： 3.删除索引返回值： 4.修改数据,直接输入依据id覆盖 5...
ElasticSearch-5 ES7 RestHighLeve
ElasticSearch-1 ES基础概念及命令操作 ElasticSearch-2 ES6 Transport...
ElasticSearch-4 ES7 RestHighLeve
ElasticSearch-1 ES基础概念及命令操作 ElasticSearch-2 ES6 Transport...

ES操作纪要

1. 创建索引、创建mapping映射、设置分词

2. 获取索引数据

3. 创建文档

4. 搜索文档（细写细读，也就是写入和读取用的分词一样）

5. 修改_settings

6.增加Mappings实现细写粗读

修改Settings

增加Mappings

写入数据

读取数据，注意要用新的mapping字段ngramFullFieldName_new

读取结果，会发现返回结果是没有单独“姓”这个返回的

7. 查看特定分词器下的分词结果

8. 查看所有索引详细数据

9. 查看某一个数据的信息（举例比如通过字段 “_id” 获取）

10. 清除ES某个索引的缓存

相关文章

ES操作纪要

ES _bulk 批量操作用法

OpenGL ES手册翻译---2.OpenGL ES操作（一）

ES操作

ES操作

ES

商炜：10.18黄金原油技术分析及操作建议

ES操作（基本操作）

ElasticSearch-5 ES7 RestHighLeve

ElasticSearch-4 ES7 RestHighLeve

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读