冗余系统就是各种冗余技术融合在一个系统中。
冗余系统在处理故障时,需要10个步骤。
1、故障检测。故障检测主要是分为两类:联机检测和脱机检测。联机检测是实时的进行检测,脱机检测需要停止系统才能进行检测。
2、故障屏蔽。故障屏蔽就是对系统的错误进行屏蔽保证系统不受故障影响。
3、故障限制。就是限制故障影响的范围,防止已发生的故障影响到系统的其他部分。
4、复执。检测瞬时性故障的有效措施,可以提高系统抗瞬时性故障的干扰。
5、故障诊断。在故障检测的基础上,对故障进行定位。
6、系统重配置。就是当故障一旦被检测出来并定位后,系统应有能力将发生故障的子系统替换下来或者隔离开来。当隔离或者替换后原系统的运行速度下降、功能会减弱。这种现象称为系统降级使用。
7、系统恢复。系统恢复就是当出现故障后能够恢复到故障断点强的情况继续运行。
8、系统重新启动。假如系统出现致命的错误时,就需要系统进行重启。重启分为热重启和冷重启。
9、修复。就是对已确定有故障的子系统进行修复。修复分为脱机修复和联机修复。假如子系统对整个系统的影响不大的话可以使用脱机修复。联机修复则是启用备份子系统替换有故障的子系统,然后修复后在还原。
10、系统重组合。上述是有步骤完成后,系统必须重新组合,已恢复正常的运行。
网友评论