十二、Elasticsearch的document数据路由及增删

作者: 书写只为分享 | 来源:发表于2019-11-19 00:12 被阅读0次

十二、Elasticsearch的document数据路由及增删
路由机制，为什么主分片数量不可变？
深度解析ES中document数据路由、增删改以及查询原理解析
二十八、Elasticsearch的document数据路由原理
前端nodejs后台系统+api接口+mongoDB数据库 +
大数据 - Es
Elasticsearch数据增删改
七、Elasticsearch手动控制全文检索结果的精准度
Python数据库mongodb的简单使用
[译] Elasticsearch 字段数据类型

1、document路由到shard上是什么意思及primary shard数量不可变的谜底？

2、路由算法：shard = hash(routing) % number_of_primary_shards

举个例子，一个index有3个primary shard，P0，P1，P2

每次增删改查一个document的时候，都会带过来一个routing number，默认就是这个document的_id（可能是手动指定，也可能是自动生成）

routing = _id，假设_id=1

会将这个routing值，传入一个hash函数中，产出一个routing值的hash值，假设为hash(routing) = 21

然后将hash函数产出的值对这个index的primary shard的数量求余数，21 % 3 = 0

就决定了，这个document就放在P0上。

决定一个document在哪个shard上，最重要的一个值就是routing值，默认是_id，也可以手动指定，相同的routing值，每次过来，从hash函数中，产出的hash值一定是相同的

无论hash值是几，无论是什么数字，对number_of_primary_shards求余数，结果一定是在0~number_of_primary_shards-1之间这个范围内的。

3、_id or custom routing value

默认的routing就是_id

也可以在发送请求的时候，手动指定一个routing value，比如说put /index/type/id?routing=user_id

手动指定routing value是很有用的，可以保证说，某一类document一定被路由到一个shard上去，那么在后续进行应用级别的负载均衡，以及提升批量读取的性能的时候，是很有帮助的

4、增删改原理

（1）客户端选择一个node发送请求过去，这个node就是coordinating node（协调节点）

（2）coordinating node，对document进行路由，将请求转发给对应的node（有primary shard）

（3）实际的node上的primary shard处理请求，然后将数据同步到replica node

（4）coordinating node，如果发现primary node和所有replica node都搞定之后，就返回响应结果给客户端

5、读原理

（1）、客户端发送请求到任意一个node，成为coordinate node

（2）、coordinate node对document进行路由，将请求转发到对应的node，此时会使用round-robin随机轮询算法，在primary shard以及其所有replica中随机选择一个，让读请求负载均衡

（3）、接收请求的node返回document给coordinate node

（4）、coordinate node返回document给客户端

（5）、特殊情况：document如果还在建立索引过程中，可能只有primary shard有，任何一个replica shard都没有，此时可能会导致无法读取到document，但是document完成索引建立之后，primary shard和replica shard就都有了

网友评论

本文标题：十二、Elasticsearch的document数据路由及增删

本文链接：https://www.haomeiwen.com/subject/jtpiictx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

十二、Elasticsearch的document数据路由及增删

相关文章