美文网首页架构社区
elasticsearch的概念与基本操作

elasticsearch的概念与基本操作

作者: 慕凌峰 | 来源:发表于2022-10-24 15:41 被阅读0次

    一、es索引的基本操作

    1、文档

    es官方文档

    2、常用操作

    • 访问es(GET请求)

      192.168.56.101:9200
      
    • 查看es健康状态(GET请求)

      192.168.56.101:9200/_cluster/health
      
    • 创建索引(PUT请求)

      • 请求地址(新增索引index_01)
      192.168.56.101:9200/index_01
      
      • 请求参数
      {
          "settings": {
              "index": {
                  "number_of_shards": "2",
                  "number_of_replicas": "0"
              }
          }
      }
      
    • 删除索引(DELETE请求)

      删除索引index_01

      192.168.56.101:9200/index_01
      
    • 查看所有索引(GET请求)

      192.168.56.101:9200/_cat/indices?v
      
    • 查看单个索引(GET请求)

      192.168.56.101:9200/index_01
      

    3、索引的mappings映射

    • 创建(PUT请求)

      创建索引 index_mapping,并添加属性realnameusernamerealname可以呗索引,username不能被索引

      192.168.56.101:9200/index_mapping
      
      {
          "mappings": {
              "properties": {
                  "realname": {
                      "type": "text",
                      "index": true
                  },
                  "username": {
                      "type": "keyword",
                      "index": false
                  }
              }
          }
      }
      

      index:默认true,设置为false的话,那么这个字段就不会被索引

    • 查看分词效果(GET请求)

      为刚创建的索引 index_mapping中的属性字段realname添加值,并查看分词效果,以下是GET请求路径和GET请求参数

      • 请求
      192.168.56.101:9200/index_mapping/_analyze
      
      {
          "field": "realname",
          "text": "落尘的秋"
      }
      
      • 结果
      {
          "tokens": [
              {
                  "token": "落",
                  "start_offset": 0,
                  "end_offset": 1,
                  "type": "<IDEOGRAPHIC>",
                  "position": 0
              },
              {
                  "token": "尘",
                  "start_offset": 1,
                  "end_offset": 2,
                  "type": "<IDEOGRAPHIC>",
                  "position": 1
              },
              {
                  "token": "的",
                  "start_offset": 2,
                  "end_offset": 3,
                  "type": "<IDEOGRAPHIC>",
                  "position": 2
              },
              {
                  "token": "秋",
                  "start_offset": 3,
                  "end_offset": 4,
                  "type": "<IDEOGRAPHIC>",
                  "position": 3
              }
          ]
      }
      
    • 为已经存在的索引添加mappings

      为 index_01 添加 mappings

      • 请求(POST)
      192.168.56.101:9200/index_01/_mapping
      
      • json参数
      {
          "properties": {
              "name": {
                     "type": "long"
              }
          }
      }
      

      <font color='bisque'>注:某个属性一旦被建立,就不能修改了,但是可以新增额外属性</font>

    二、es的数据类型

    1、基本数据类型

    • text, keyword, string
    • long, integer, short, byte
    • double, float
    • boolean
    • date
    • object
    • 数组不能混,类型一致

    2、字符串

    • text

      文字类需要被分词被倒排索引的内容,比如商品名称商品详情商品介绍,使用text。

    • keyword

      不会被分词,不会被倒排索引,直接匹配搜索,比如订单状态用户qq微信号手机号等,这些精确匹配,无需分词。

    三、文档相关

    1、基本操作

    • 添加文档

      创一个临时索引 index_doc,往这个索引中添加文档(类似于数据库中添加一条数据),对一个文档进行全量更新也是一样的方式,即为替换

      • 请求(POST)
    192.168.56.101:9200/index_doc/_doc/1
    

    说明:index_doc(索引名称)/_doc(添加文档请求固定写法)/1(文档id,可以不写,会自动生成)

    • 参数
    {
        "id": 1001,
        "name": "job-1",
        "desc": "this is a good job, 这是一个好工作!",
        "create_date": "2022-10-22"
    }
    
    • 注意

      • 如果索引没有手动建立mappings,那么当插入文档数据的时候,会根据文档类型自动设置属性类型。这个就是es的动态映射,帮我们在index索引库中去建立数据结构的相关配置信息。

      • “fields”: {“type”: “keyword”}
        对一个字段设置多种索引模式,使用text类型做全文检索,也可使用keyword类型做聚合和排序

      • “ignore_above” : 256
        设置字段索引和存储的长度最大值,超过则被忽略

    • 文档删除(DELETE)

      192.168.56.101:9200/index_doc/_doc/100
      

      说明:index_doc(索引名称)/_doc(说明要删除的时一个文档)/1(文档id,指明要删除的文档)

      这种删除是逻辑删除不是物理删除

    • 全量更新doc(POST)

      整个doc中source信息会被新的数据完全替换掉

      192.168.56.101:9200/index_doc/_doc/2
      
      {
          "doc": {
              "name" : "好工作"
          }
      }
      
    • 更新某个字段信息

      只更新name

    ```
    192.168.56.101:9200/index_test/_update/2
    ```
    
    ```json
    {
        "doc": {
            "name" : "好工作"
        }
    }
    ```
    
    • 更新文档

      每次修改后version都会进行修改

      • 请求(POST)
    • 查询某个索引的特定的文档信息(GET)

      查询结构包含所有的source信息

      192.168.56.101:9200/index_doc/_doc/2(文档id信息)
      
    • 查询某个索引的所有文档信息(GET)

      192.168.56.101:9200/index_doc/_doc/_search
      
    • 查询某个索引下特定文档中的特定信息(GET)

      只查看id,name信息,属性之间用“,”隔开

      192.168.56.101:9200/index_doc/_doc/2?_source=id,name
      
    • 查询某个索引下所有文档中的特定信息(GET)

      192.168.56.101:9200/index_doc/_doc/_search?_source=id,name
      
    • 判断文档是否存在(HEAD)

      192.168.56.101:9200/index_doc/_doc/2
      

      判断返回的状态吗status,200表示存在,404表示不存在

    2、元数据

    数据结构说明

    • _index:文档数据所属那个索引,理解为数据库的某张表即可。
    • _type:文档数据属于哪个类型,新版本使用_doc
    • _id:文档数据的唯一标识,类似数据库中某张表的主键。可以自动生成或者手动指定。
    • _score:查询相关度,是否契合用户匹配,分数越高用户的搜索体验越高。
    • _version:版本号。
    • _source:文档数据,json格式。

    3、文档乐观锁控制

    ?if_seq_no={数值}&if_primary_term={数值

    • 插入新的数据

      POST /my_doc/_doc
      {
          "id": 1010,
          "name": "imooc-1010",
          "desc": "imoocimooc!",
          "create_date": "2019-12-24"
      }
      # 此时 _version 为 1
      
    • 修改数据

      POST    /my_doc/_doc/{_id}/_update
      {
          "doc": {
              "name": "修改测试"
          }
      }
      # 此时 _version 为 2
      
    • 模拟两个客户端操作同一个文档数据,_version都携带为一样的数值

      # 操作1
      POST    /my_doc/_doc/{_id}/_update?if_seq_no={数值}&if_primary_term={数值}
      {
          "doc": {
              "name": "操作1"
          }
      }
      
      # 操作2
      POST    /my_doc/_doc/{_id}/_update?if_seq_no={数值}&if_primary_term={数值}
      {
          "doc": {
              "name": "操作2"
          }
      }
      

    相关文章

      网友评论

        本文标题:elasticsearch的概念与基本操作

        本文链接:https://www.haomeiwen.com/subject/qnjgzrtx.html