美文网首页
es的故障应对

es的故障应对

作者: yeren108 | 来源:发表于2018-06-07 15:59 被阅读15次

我们现在假设有一个这样的集群,有3个主分片,有6各复制分片如下图所示:


es完整集群

我们杀掉一个master节点来模拟故障。一个集群必须要有一个主节点才能使其功能正常,所以集群做的第一件事就是各个节点选举一个新的主节点:node2。主分片p_a0在我们杀掉node1时已经丢失了,我们的索引在丢失主分片时不能正常工作。如果此时检查集群健康,我们将看到状态red:不是所有的主分片都可用!

幸运的是丢失的一个主分片的完整拷贝存在于其他节点上,所以新主节点做的第一件事是把这个在node2或node3上的复制分片升级为主分片,这时集群健康回到yellow状态。这个提升是瞬间完成的,就好像按了一下开关。看起来就像下图这个样子:


down了一个节点的es集群

为什么集群的健康状态是yellow而不是green?我们有三个主分片,但是我们指定了每个主分片对应两个复制分片,当前却只有一个复制分片被分配,这就是集群状态无法达到green的原因,不过不用太担心这个:当我们杀掉node2,我们的程序依然可以在没有丢失数据的情况下继续运行,因为node3还有每个分片的拷贝。

如果我们重启node1,集群将能够重新分配丢失的复制分片,集群状况与之前类似。如果node1依旧有旧分片的拷贝,它将会尝试再次利用它们,它只会从主分片上复制在故障期间有数据变更的那一部分。

相关文章

  • es的故障应对

    我们现在假设有一个这样的集群,有3个主分片,有6各复制分片如下图所示: 我们杀掉一个master节点来模拟故障。一...

  • ES 故障

    2019-10-18 primary shard lost unassigned_info "can_alloca...

  • redis持久化

    为了更好应对故障恢复。

  • 31 | 如何应对接口级的故障?

    异地多活方案主要应对系统级的故障,例如,机器宕机、机房故障、网络故障等问题,这些系统级的故障虽然影响很大,但发生概...

  • 架构总结30--如何应对接口级的故障

    异地多活方案主要应对系统级的故障,例如,机器宕机、机房故障、网络故障等问题,这些系统级的故障虽然影响很大,但发生概...

  • [ElasticSearch填坑] 聚合请求导致GC故障

    故障描述: 某天对Es做多次查询请求,发现Es集群经常挂掉,无法响应。 定位问题: 我们的Es在之前较长时间内未出...

  • elasticsearch集群应对故障

    假设Elasticsearch集群存在A、B、C三个节点,A为Master, B,C为Node。如果A出现故障,那...

  • 不安分的电脑和手机

    最近我的二手MacBook Air开始出故障,于是日更挑战又中断了。 故障:无故黑屏关机,怎么也开不开。 应对方法...

  • 线上运行的Java应用出故障了!我慌得一匹!

    线上运行的Java应用突然没有响应、响应缓慢,进程突然消失,遇到这些情况应该如何应对呢? 今天教大家如何应对在线故障!

  • 3、spring cloud hystrix

    hystrix使用背景和场景 所有的系统,特别是分布式系统,都会遇到故障,如何构建系统应对这种故障呢?当服务崩溃了...

网友评论

      本文标题:es的故障应对

      本文链接:https://www.haomeiwen.com/subject/ktcbsftx.html