美文网首页
分片分配和集群路由

分片分配和集群路由

作者: caster | 来源:发表于2020-11-16 15:47 被阅读0次

    对应72.官放文档路径:Modules » Shard allocation and cluster-level routing
    官方地址如下:
    https://www.elastic.co/guide/en/elasticsearch/reference/7.2/modules-cluster.html

    分片分配和集群路由

    主节点的一个重要角色就是决定哪个分片分配到哪个节点,移动分片到不同节点目的是为了平衡集群。
    以下设置可以控制分片分配过程:

    集群级别分片分配:一些控制分配和平衡的设置
    基于磁盘的分片分配:阐述es如何考虑可用磁盘空间以及相关设置
    分片分配感知和强制感知:控制分片如何在不同机架或者区域分配
    集群级分片分配过滤:允许某些节点或某些节点组从分配中排除,以便将其停用
    除此以外,还有一些其他混杂的集群级别设置

    这部分的设置都是动态设置,可以在活动的集群上使用用集群设置更新api动态更新。

    1. 集群级别分片分配

    分片分配是将分片分配到节点的过程,可能发生在初始化恢复,副本分配,重新平衡,节点的添加和移除的过程中。

    分片分配设置

    以下动态设置可以用来控制分片分配和恢复:

    cluster.routing.allocation.enable

    启用或者禁用某些种类分片的分配:
    all(默认):允许全部种类分片分配
    primaries:只允许主分片分配
    new_primaries:允许新建的索引的主分片分配
    none:不允许任何分片分配

    cluster.routing.allocation.node_concurrent_incoming_recoveries

    在一个node上允许同时恢复多少个shard,默认2

    cluster.routing.allocation.node_concurrent_outgoing_recoveries

    一个node上允许同时进行多少个shard recovery outgoing,比如这个node上,有一个primary shard,现在要将replica shard分配给其他的node,那么就是outgoing shard recovery。默认值也是2

    cluster.routing.allocation.node_concurrent_recoveries

    同时设置上面两个值

    cluster.routing.allocation.node_initial_primaries_recoveries

    在如果replica shard recovery通过网络传输来分配,那么一个未被分配的primary shard会在node重启之后使用本地磁盘上的数据,这个过程因为是使用本地的数据,因此会比较快,默认值是4

    cluster.routing.allocation.same_shard.host

    默认值是false,如果设置为true,那么就不允许将一个primary shard和replica shard分配到同一个物理机上,也许这个物理机上启动了多个es实例。

    分片重新平衡设置

    以下动态设置可用于控制整个群集中的分片重新平衡:

    cluster.routing.rebalance.enable

    all(默认):允许对所有类型的shard进行rebalance过程
    primaries:仅仅允许对primary shard进行rebalance过程
    replicas:仅仅允许对replica shard进行rebalance
    none:不允许对任何shard进行rebalance

    cluster.routing.allocation.allow_rebalance

    always:任何时候都允许rebalance
    indices_primaries_active:仅在分配了集群中的所有主分片时,才能rebalance
    indices_all_active(默认):仅允许所有的主副分片都被分配之后,才能rebalance

    cluster.routing.allocation.cluster_concurrent_rebalance

    允许控制多少个shard rebalance的操作同时运行,默认是2

    分片平衡探索

    //todo

    2. 基于磁盘的分片分配

    默认85%不再分配分片,90%将移走分片,95%触发read_only

    3. 分片分配感知(不强制 or 强制)

    你可以使用自定义节点属性作为感知属性,以使es在分配分片时考虑你的物理硬件配置。如果es知道哪些节点在同一个物理服务器上,同一个机架或者同一个区域,他可以分发主/副分片到不同地方,以最大程度减少发生故障时丢失全部分片的风险。
    当分片分配感知通过cluster.routing.allocation.awareness.attributes设置生效时,分片将仅分配给具有设置了特殊感知属性值的节点。如果设置了多个感知属性,es将分别考虑他们。
    分配感知属性可以在yml文件中设置,或者通过cluster-update-settings api动态更新。
    es倾向于在同一位置(相同感知属性值)的分片上进行search,get请求,使用本地shards将会比跨机架和区域边界更快。
    注:属性值的数量决定了每个位置分配了多少个分片副本。如果每个位置中的节点数量不平衡,并且有很多副本,则副本分片可能未分配。

    启用分片分配感知

    1. 使用自定义节点属性指定每个节点的位置。例如,你想让es分配分片在不同的机架,你可以在每个节点的yml文件中定义一个感知属性叫做rack_id:
    node.attr.rack_id: rack_one
    

    你也可以在启动节点的时候设置自定义属性:

    ./bin/elasticsearch -Enode.attr.rack_id=rack_one
    
    1. 通过设置每个有资格成为主节点的yml配置文件:添加cluster.routing.allocation.awareness.attributes设置,告诉es在分配分片的时候考虑一个或者多个感知属性:
    cluster.routing.allocation.awareness.attributes: rack_id
    

    注:多个属性以逗号分割填写
    你也可以通过cluster-update-settings api设置或者更新集群感知属性。

    使用以上例子的配置,如果你启动两个node.attr.rack_idrack_one的节点,并创建一个5个主分片一个副本的索引,则全部的主分片和副本将分配到这两个节点。
    如果你再添加两个node.attr.rack_idrack_two的节点,es将移动分片到新的节点。来保证没有分片和其副本在同一个rack里面(如果可以做到的话)。
    当rack_two的节点都挂掉,默认es将分配丢失的分片副本到rack_one。为了避免某一特定分片的副本分配到相同的区域,你可以使用强制感知。

    强制感知

    默认的,如果一个区域失败了,es将分配所有丢失的副本到尚存的区域。也许你拥有充足的跨区域资源来持有你的全部主分片和副本分片,但是一个区域也许不能持有全部的分片。
    为了避免发生故障时某一个区域过载,你可以设置cluster.routing.allocation.awareness.force,这样直到其他的区域可用才会分配副本。
    例如,你有一个感知属性zone,配置了节点分别为zone1,zone2,你可以用强制感知来避免es在只有一个zone区域可用时分配副本。

    cluster.routing.allocation.awareness.attributes: zone
    cluster.routing.allocation.awareness.force.zone.values: zone1,zone2
    

    为感知属性指定所有可能的值:
    通过以上的例子,当你启动两个node.attr.zone为zone1的节点,并创建一个5分片1副本的索引,es将创建索引并分配5个主分片,但是副本不会分配,除非有一个node.attr.zone为zone2的节点可用。

    4. 集群级别分片分配过滤

    你可以使用集群级别分片分配过滤控制es将任何索引的分片分配到哪里,这个集群级别的过滤可以和每个索引分配过滤和分配感知配合使用。
    分片分配过滤可以基于自定义节点属性或者内置的属性_name,_ip或者_host。
    cluster.routing.allocation设置是动态的,允许将活动的索引从一组节点移动到另一组节点。分片只有在不打破其他路由规则的前提条件下才可以移动,例如不能将主副分片移动到同一个节点。
    最常用的集群级别分片分配过滤就是当你想下线一个节点的时候,将分片从此节点一走后停止这个节点,可以使用如下api通过ip过滤此节点:

    PUT _cluster/settings
    {
      "transient" : {
        "cluster.routing.allocation.exclude._ip" : "10.0.0.1"
      }
    }
    

    集群路由设置

    cluster.routing.allocation.include.{attribute}
    将分片分配给attribute属性至少匹配一个逗号分隔中的值的节点。
    cluster.routing.allocation.require.{attribute}
    仅将分片分配给attribute属性具有所有逗号分隔后的值的节点。
    cluster.routing.allocation.exclude.{attribute}
    禁止将分片分配给attribute属性具有任何一个逗号分隔后的值的节点。

    集群分配设置支持一下内置属性

    _name :通过节点名字匹配
    _ip :通过ip地址匹配(与hostname相关联的ip)
    _host :通过hostname匹配
    你可以使用通配符描述属性值,例如:

    PUT _cluster/settings
    {
      "transient": {
        "cluster.routing.allocation.exclude._ip": "192.168.2.*"
      }
    }
    

    5. 其他集群设置

    cluster.blocks.read_only
    将整个群集设为只读(索引不接受写操作),不允许修改元数据(创建或删除索引)。
    cluster.blocks.read_only_allow_delete
    与cluster.blocks.read_only索引相同,但允许删除索引以释放资源
    cluster.max_shards_per_node
    控制每个数据节点在集群中允许的分片数量
    ……

    相关文章

      网友评论

          本文标题:分片分配和集群路由

          本文链接:https://www.haomeiwen.com/subject/ioqvbktx.html