美文网首页
系统架构设计笔记(92)—— 可靠性与故障模型

系统架构设计笔记(92)—— 可靠性与故障模型

作者: deniro | 来源:发表于2020-10-19 20:06 被阅读0次

    1 故障的来源以及表现

    下面先介绍几个概念。
    (1)失效:硬件的物理改变。
    (2)故障:由于部件的失效、环境的物理干扰、操作错误或不正确的设计引起的硬件或软件中的错误状态。
    (3)错误(差错):故障在程序或数据结构中的具体位置。错误与故障位置之间可能出现一定距离。

    故障或错误有如下几种表现形式。
    永久性:描述连续稳定的失效 、 故障或错误。在硬件中,永久性失效反映了不可恢复的物理改变。
    间歇性:描述那些由于不稳定的硬件或变化着的硬件或软件状态所引起的 、 仅仅是偶然出现的故障或错误。
    瞬时性:描述那些由于暂时的环境条件而引起的故障或错误。

    一个故障可能由物理失效 、 不适当的系统设计 、 环境影响或系统的操作员所引起。永久性失效会导致永久性故障。间歇性故障可能由不稳定 、 临界稳定或不正确的设计所引起。环境条件会造成瞬时性故障。所有这些故障都可能引起错误。不正确的设计和操作员失误会直接引起错误。由硬件的物理条件,不正确的硬件或软件设计,或不稳定但重复出现的环境条件所引起的故障可能是可检测的,并且可以通过替换或重新设计来修复;然而,由于暂时的环境条件所引起的故障是不能修复的,因为其硬件本身实际上并没有损坏。瞬时和间歇故障已经成为系统中的一个主要错误源。

    2 几种常用的故障模型

    故障的表现形式千差万别,可以利用故障模型对千差万别的故障表现进行抽象。故障模型可以在系统的各个级别上建立。一般说来,故障模型建立的级别越低,进行故障处理的代价也越低,但故障模型复盖的故障也越少。如果在某一级别的故障模型不能包含故障的某些表现,则可以用更高一级别的模型来概括。下面介绍几种常用的故障模型。

    2.1 逻辑级的故障模型

    固定型故障指电路中元器件的输入或输出等线的逻辑固定为 0 或固定为1,如某线接地 、 电源短路或元件失效等都可能造成固定型故障。

    短路故障是指一个元件的输出线的逻辑值恒等于输入线的逻辑值;

    元件的开路故障是元件的输出线悬空,逻辑值可根据具体电路来决定。

    桥接故障指两条不应相连的线连接在一起而发生的故障。

    2.2 数据结构级的故障

    故障在数据结构上的表现称为差错。常见的差错如下。

    独立差错:一个故障的影响表现为使一个二进制位发生改变。

    算术差错:一个故障的影响表现为使一个数据的值增加或减少 2i(i= 0 ,1,2, …)。

    单向差错:一个故障的影响表现为使一个二进制向量中的某些位朝一个方向( 0 或1)改变。

    2.3 软件故障和软件差错

    软件故障是指软件设计过程造成的与设计说明的不一致的情况,软件故障在数据结构或程序输出中的表现称为软件差错。与硬件不同,软件不会因为环境压力而疲劳,也不会因为时间的推移而衰老。因此,软件故障只与设计有关。

    常见的软件差错有以下几种。
    非法转移:程序执行了说明中不存在的转移。
    误转移:程序执行了尽管说明中存在,但依据当前控制数据不应进行的转移。
    死循环:程序执行时间超过了规定界限。
    空间溢出:程序使用的空间超过了规定的界限。
    数据执行:指令计数器指向数据单元。
    无理数据:程序输出的数据不合理。

    2.4 系统级的故障模型

    在系统级上的表现为功能错误,即系统输出与系统设计说明的不一致。如果系统输出无故障保护机构,则故障在系统级上的表现就会造成系统失效。


    相关文章

      网友评论

          本文标题:系统架构设计笔记(92)—— 可靠性与故障模型

          本文链接:https://www.haomeiwen.com/subject/lvmkuktx.html