美文网首页程序员读书简友广场
分布式存储系统的故障分类

分布式存储系统的故障分类

作者: 皮皮杂谈 | 来源:发表于2019-04-20 08:32 被阅读10次

高可用的系统需要解决的是在不同故障情况下都保持较高的系统可用性,但是不同故障类型带来的问题复杂性不同,不可能使用一种解决方案处理所有情况,所以需要针对各种故障提供具体解决方案。那么,对于一个分布式存储系统而言,影响系统整体可用性的故障有哪些呢?本文将重点描述分布式存储系统的故障分类。

分布式存储系统的故障分为三大类,如下图所示:

故障分类

瞬时故障:引起这类故障的主要原因是网络通讯瞬间中断、服务器内存垃圾回收或后台线程繁忙停止数据访问操作响应。其特点是故障时间短,在秒级甚至毫秒级系统即可自行恢复正常响应。

临时故障:引起这类故障的主要原因是交换机宕机、网卡松动等导致的网络通讯中断;系统升级、停机维护等一般运维活动引起的服务关闭;内存损坏、CPU过热等硬件原因导致的服务器宕机;这类故障的主要特点是需要人工干预(更换硬件、重启机器等)才能恢复正常。通常持续时间需要几十分钟甚至几小时。故障时间可分为两个阶段:临时故障期间,临时故障恢复期间。

永久故障:引起这类故障的主要原因只有一个:硬盘损坏,数据丢失。虽然损坏硬盘和损坏内存一样,可以通过更换硬盘来重新启动机器,但是丢失的数据却永远找不回来了,因此其处理策略也和前面两种故障完全不同,恢复系统到正常状态也需要更长的时间。故障时间可分为两个阶段:永久故障期间和永久故障恢复期间。

相关文章

  • 分布式存储系统的故障分类

    高可用的系统需要解决的是在不同故障情况下都保持较高的系统可用性,但是不同故障类型带来的问题复杂性不同,不可能使用一...

  • 【学习】数据分布算法考虑因素

    数据分布是分布式存储系统的一个重要部分。 1. 故障域隔离 同份数据的不同副本分布在不同的故障域,降低数据损坏的...

  • Hadoop相关介绍

    分布式存储系统HDFS(Hadoop Distributed File System)POSIX 分布式存储系统 ...

  • 这样的spark你喜欢吗?

    BlockManager定义 BlockManager是Spark的分布式存储系统,与我们平常说的分布式存储系统是...

  • 前端nginx反代后端mogilefs存储实战实例

    一、MogileFS存储 1、MogileFS分布式文件存储系统 MogileFS是一个开源的分布式文件存储系统,...

  • 什么是Ulord的分布式储存?

    一、分布式储存的概念分布式存储系统的传统定义:“分布式存储系统是大量PC服务器通过Internet互联,对外提供一...

  • 分布式存储

    认识分布式存储 分布式存储系统,是通过网络将数据分散存储在多台独立的设备上。 分布式存储系统的特性 可扩展分布式存...

  • 分布式存储

    Ceph Ceph是一个可靠、自动重均衡、自动恢复的分布式存储系统。Ceph没有单点故障的问题,数据强一致性,在部...

  • 学一点Ceph知识:初识Ceph

    Ceph是什么? Ceph是一个开源的分布式存储系统,可大规模扩展、高性能、无单点故障,在普通的服务器上可以支持到...

  • 《分布式技术原理与算法解析》学习笔记Day21

    分布式数据存储三要素 什么是分布式数据存储系统? 分布式存储系统的核心逻辑,就是将用户需要存储的数据根据某种规则存...

网友评论

    本文标题:分布式存储系统的故障分类

    本文链接:https://www.haomeiwen.com/subject/tifkgqtx.html