美文网首页
文档批量操作

文档批量操作

作者: 该死的金箍 | 来源:发表于2024-05-19 18:04 被阅读0次

ElasticSearch文档批量操作
批量操作可以减少网络连接所产生的开销,提升性能

  • 支持在一次API调用中,对不同的索引进行操作
  • 可以再URI中指定Index,也可以在请求的Payload中进行
  • 操作中单条操作失败,并不会影响其他操作
  • 返回结果包括了每一条操作执行的结果

批量写入
批量对文档进行写操作是通过_bulk的API来实现的

  • 请求方式:POST
  • 请求地址:_bulk
  • 请求参数:通过_bulk操作文档,一般至少有两行参数(或偶数行参数)
  • 第一行参数为指定操作的类型及操作的对象(index,type和id)
    第二行参数才是操作的数据

参数类似于:

{"actionName":{"_index":"indexName", "_type":"typeName","_id":"id"}}
{"field1":"value1", "field2":"value2"}
{"actionName":{"_index":"indexName", "_type":"typeName","_id":"id"}}
{"field1":"value1", "field2":"value2"}
  • actionName:表示操作类型,主要有create,index,delete和update

批量创建文档create

POST _bulk
{"create":{"_index":"obj", "_type":"_doc", "_id":3}}
{"id":3,"title":"A老师","content":"老师666","tags":["php", "面向对
象"],"create_time":1756415482530}
{"create":{"_index":"obj", "_type":"_doc", "_id":4}}
{"id":4,"title":"B老师","content":"老师NB","tags":["go", "面向对
象"],"create_time":1756415482530}
使用create如果id=3的已经存在 就会报错

普通创建或全量替换index

POST _bulk
{"index":{"_index":"obj", "_type":"_doc", "_id":3}}
{"id":3,"title":"A老师","content":"老师666","tags":["php", "面向对
象"],"create_time":1756415482530}
{"index":{"_index":"obj", "_type":"_doc", "_id":4}}
{"id":4,"title":"B老师","content":"老师NB","tags":["go", "面向对
象"],"create_time":1756415482530}
  • 如果原文档不存在,则是创建
  • 如果原文档存在,则是替换(全量修改原文档)

批量删除delete

POST _bulk
{"delete":{"_index":"obj", "_type":"_doc", "_id":3}}
{"delete":{"_index":"obj", "_type":"_doc", "_id":4}}

批量修改update

POST _bulk
{"update":{"_index":"obj", "_type":"_doc", "_id":3}}
{"doc":{"title":"ES大法必修内功"}}
{"update":{"_index":"obj", "_type":"_doc", "_id":4}}
{"doc":{"create_time":1756415482530}}

组合应用

POST _bulk
{"delete":{"_index":"obj", "_type":"_doc", "_id":3}}
{"create":{"_index":"obj", "_type":"_doc", "_id":3}}
{"title":"老师","content":"老师666","tags":["java", "面向对
象"],"create_time":1756415482530}
{"update":{"_index":"obj", "_type":"_doc", "_id":4}}
{"doc":{"create_time":1756415482530}}

批量读取:_mget
es的批量查询可以使用mget和msearch两种。其中mget是需要我们知道它的id,可以指定不同的
index,也可以指定返回值source。msearch可以通过字段查询来进行一个批量的查找。

#可以通过ID批量获取不同index和type的数据
GET _mget
{
  "docs": [
    {
      "_index": "document",
      "_id": 1
    },
    {
      "_index": "obj",
      "_id": 4
    }
  ]
}

#可以通过ID批量获取es_db的数据
GET obj/_mget
{
  "ids"  : [1,2]
}

_msearch
在_msearch中,请求格式和bulk类似。查询一条数据需要两个对象,第一个设置index和type,第二个
设置查询语句。查询语句和search相同。如果只是查询一个index,我们可以在url中带上index,这样,
如果查该index可以直接用空对象表示。

GET _msearch
{"index":"obj"}
{"query":{"match_all":{}},"from":0,"size":2}
{"index":"document"}
{"query":{"match_all":{}}} 

GET obj/_msearch
{}
{"query":{"match_all":{}},"from":0,"size":2}
{"index":"document"}
{"query":{"match_all":{}}} 

相关文章

网友评论

      本文标题:文档批量操作

      本文链接:https://www.haomeiwen.com/subject/swnmfjtx.html