ElasticSearch文档批量操作
批量操作可以减少网络连接所产生的开销,提升性能
- 支持在一次API调用中,对不同的索引进行操作
- 可以再URI中指定Index,也可以在请求的Payload中进行
- 操作中单条操作失败,并不会影响其他操作
- 返回结果包括了每一条操作执行的结果
批量写入
批量对文档进行写操作是通过_bulk的API来实现的
- 请求方式:POST
- 请求地址:_bulk
- 请求参数:通过_bulk操作文档,一般至少有两行参数(或偶数行参数)
- 第一行参数为指定操作的类型及操作的对象(index,type和id)
第二行参数才是操作的数据
参数类似于:
{"actionName":{"_index":"indexName", "_type":"typeName","_id":"id"}}
{"field1":"value1", "field2":"value2"}
{"actionName":{"_index":"indexName", "_type":"typeName","_id":"id"}}
{"field1":"value1", "field2":"value2"}
- actionName:表示操作类型,主要有create,index,delete和update
批量创建文档create
POST _bulk
{"create":{"_index":"obj", "_type":"_doc", "_id":3}}
{"id":3,"title":"A老师","content":"老师666","tags":["php", "面向对
象"],"create_time":1756415482530}
{"create":{"_index":"obj", "_type":"_doc", "_id":4}}
{"id":4,"title":"B老师","content":"老师NB","tags":["go", "面向对
象"],"create_time":1756415482530}
使用create如果id=3的已经存在 就会报错
普通创建或全量替换index
POST _bulk
{"index":{"_index":"obj", "_type":"_doc", "_id":3}}
{"id":3,"title":"A老师","content":"老师666","tags":["php", "面向对
象"],"create_time":1756415482530}
{"index":{"_index":"obj", "_type":"_doc", "_id":4}}
{"id":4,"title":"B老师","content":"老师NB","tags":["go", "面向对
象"],"create_time":1756415482530}
- 如果原文档不存在,则是创建
- 如果原文档存在,则是替换(全量修改原文档)
批量删除delete
POST _bulk
{"delete":{"_index":"obj", "_type":"_doc", "_id":3}}
{"delete":{"_index":"obj", "_type":"_doc", "_id":4}}
批量修改update
POST _bulk
{"update":{"_index":"obj", "_type":"_doc", "_id":3}}
{"doc":{"title":"ES大法必修内功"}}
{"update":{"_index":"obj", "_type":"_doc", "_id":4}}
{"doc":{"create_time":1756415482530}}
组合应用
POST _bulk
{"delete":{"_index":"obj", "_type":"_doc", "_id":3}}
{"create":{"_index":"obj", "_type":"_doc", "_id":3}}
{"title":"老师","content":"老师666","tags":["java", "面向对
象"],"create_time":1756415482530}
{"update":{"_index":"obj", "_type":"_doc", "_id":4}}
{"doc":{"create_time":1756415482530}}
批量读取:_mget
es的批量查询可以使用mget和msearch两种。其中mget是需要我们知道它的id,可以指定不同的
index,也可以指定返回值source。msearch可以通过字段查询来进行一个批量的查找。
#可以通过ID批量获取不同index和type的数据
GET _mget
{
"docs": [
{
"_index": "document",
"_id": 1
},
{
"_index": "obj",
"_id": 4
}
]
}
#可以通过ID批量获取es_db的数据
GET obj/_mget
{
"ids" : [1,2]
}
_msearch
在_msearch中,请求格式和bulk类似。查询一条数据需要两个对象,第一个设置index和type,第二个
设置查询语句。查询语句和search相同。如果只是查询一个index,我们可以在url中带上index,这样,
如果查该index可以直接用空对象表示。
GET _msearch
{"index":"obj"}
{"query":{"match_all":{}},"from":0,"size":2}
{"index":"document"}
{"query":{"match_all":{}}}
GET obj/_msearch
{}
{"query":{"match_all":{}},"from":0,"size":2}
{"index":"document"}
{"query":{"match_all":{}}}
网友评论