美文网首页java从0到架构师
97_es生产集群部署之针对生产集群的脑裂问题专门定制的重要参数

97_es生产集群部署之针对生产集群的脑裂问题专门定制的重要参数

作者: 小山居 | 来源:发表于2020-03-05 18:19 被阅读0次

    97_es生产集群部署之针对生产集群的脑裂问题专门定制的重要参数

    最少master候选节点以及脑裂问题

    <meta charset="utf-8">

    image.png

    discovery.zen.minimum_master_nodes参数对于集群的可靠性来说,是非常重要的。这个设置可以预防脑裂问题,也就是一个集群中存在两个master。

    如果因为网络的故障,导致一个集群被划分成了两片,每片都有多个node,以及一个master,那么集群中就出现了两个master了。但是因为master是集群中非常重要的一个角色,主宰了集群状态的维护,以及shard的分配,因此如果有两个master的话,可能会导致破坏数据。

    那么那个参数的作用,就是告诉es直到有足够的master候选节点时,才可以选举出一个master,否则就不要选举出一个master。这个参数必须被设置为集群中master候选节点的quorum数量,也就是大多数。至于quorum的算法,就是:master候选节点数量 / 2 + 1。

    比如我们有10个节点,都能维护数据,也可以是master候选节点,那么quorum就是10 / 2 + 1 = 6。

    如果我们有三个master候选节点,还有100个数据节点,那么quorum就是3 / 2 + 1 = 2

    如果我们有2个节点,都可以是master候选节点,那么quorum是2 / 2 + 1 = 2。此时就有问题了,因为如果一个node挂掉了,那么剩下一个master候选节点,是无法满足quorum数量的,也就无法选举出新的master,集群就彻底挂掉了。此时就只能将这个参数设置为1,但是这就无法阻止脑裂的发生了。

    生产集群避免只有两个node的现象分析

    image.png

    2个节点,discovery.zen.minimum_master_nodes分别设置成2和1会怎么样

    综上所述,一个生产环境的es集群,至少要有3个节点,同时将这个参数设置为quorum,也就是2。discovery.zen.minimum_master_nodes设置为2,

    如何避免脑裂呢?

    那么这个是参数是如何避免脑裂问题的产生的呢?比如我们有3个节点,quorum是2.现在网络故障,1个节点在一个网络区域,另外2个节点在另外一个网络区域,不同的网络区域内无法通信。这个时候有两种情况情况:

    (1)如果master是单独的那个节点,另外2个节点是master候选节点,那么此时那个单独的master节点因为没有指定数量的候选master node在自己当前所在的集群内,因此就会取消当前master的角色,尝试重新选举,但是无法选举成功。然后另外一个网络区域内的node因为无法连接到master,就会发起重新选举,因为有两个master候选节点,满足了quorum,因此可以成功选举出一个master。此时集群中就会还是只有一个master。

    (2)如果master和另外一个node在一个网络区域内,然后一个node单独在一个网络区域内。那么此时那个单独的node因为连接不上master,会尝试发起选举,但是因为master候选节点数量不到quorum,因此无法选举出master。而另外一个网络区域内,原先的那个master还会继续工作。这也可以保证集群内只有一个master节点。

    综上所述,通过在elasticsearch.yml中配置discovery.zen.minimum_master_nodes: 2,就可以避免脑裂问题的产生。

    但是因为es集群是可以动态增加和下线节点的,所以可能随时会改变quorum。所以这个参数也是可以通过api随时修改的,特别是在节点上线和下线的时候,都需要作出对应的修改。而且一旦修改过后,这个配置就会持久化保存下来。

    脑裂问题解决的原理分析


    image.png
    PUT /_cluster/settings
    
    {
    
    "persistent" : {
    
    "discovery.zen.minimum_master_nodes" : 2
    
    }
    
    }
    

    相关文章

      网友评论

        本文标题:97_es生产集群部署之针对生产集群的脑裂问题专门定制的重要参数

        本文链接:https://www.haomeiwen.com/subject/yoqcrhtx.html