美文网首页
十二、Elasticsearch的document数据路由及增删

十二、Elasticsearch的document数据路由及增删

作者: 书写只为分享 | 来源:发表于2019-11-19 00:12 被阅读0次

    1、document路由到shard上是什么意思primary shard数量不可变的谜底

    2、路由算法:shard = hash(routing) % number_of_primary_shards

    举个例子,一个index有3个primary shard,P0,P1,P2

    每次增删改查一个document的时候,都会带过来一个routing number,默认就是这个document的_id(可能是手动指定,也可能是自动生成)

    routing = _id,假设_id=1

    会将这个routing值,传入一个hash函数中,产出一个routing值的hash值,假设为hash(routing) = 21

    然后将hash函数产出的值对这个index的primary shard的数量求余数,21 % 3 = 0

    就决定了,这个document就放在P0上。

    决定一个document在哪个shard上,最重要的一个值就是routing值,默认是_id,也可以手动指定,相同的routing值,每次过来,从hash函数中,产出的hash值一定是相同的

    无论hash值是几,无论是什么数字,对number_of_primary_shards求余数,结果一定是在0~number_of_primary_shards-1之间这个范围内的。

    3、_id or custom routing value

    默认的routing就是_id

    也可以在发送请求的时候,手动指定一个routing value,比如说put /index/type/id?routing=user_id

    手动指定routing value是很有用的,可以保证说,某一类document一定被路由到一个shard上去,那么在后续进行应用级别的负载均衡,以及提升批量读取的性能的时候,是很有帮助的

    4、增删改原理

    (1)客户端选择一个node发送请求过去,这个node就是coordinating node(协调节点)

    (2)coordinating node,对document进行路由,将请求转发给对应的node(有primary shard)

    (3)实际的node上的primary shard处理请求,然后将数据同步到replica node

    (4)coordinating node,如果发现primary node和所有replica node都搞定之后,就返回响应结果给客户端

    5、读原理

    (1)、客户端发送请求到任意一个node,成为coordinate node

    (2)、coordinate node对document进行路由,将请求转发到对应的node,此时会使用round-robin随机轮询算法,在primary shard以及其所有replica中随机选择一个,让读请求负载均衡

    (3)、接收请求的node返回document给coordinate node

    (4)、coordinate node返回document给客户端

    (5)、特殊情况:document如果还在建立索引过程中,可能只有primary shard有,任何一个replica shard都没有,此时可能会导致无法读取到document,但是document完成索引建立之后,primary shard和replica shard就都有了

    相关文章

      网友评论

          本文标题:十二、Elasticsearch的document数据路由及增删

          本文链接:https://www.haomeiwen.com/subject/jtpiictx.html