1 故障的来源以及表现
下面先介绍几个概念。
(1)失效:硬件的物理改变。
(2)故障:由于部件的失效、环境的物理干扰、操作错误或不正确的设计引起的硬件或软件中的错误状态。
(3)错误(差错):故障在程序或数据结构中的具体位置。错误与故障位置之间可能出现一定距离。
故障或错误有如下几种表现形式。
永久性:描述连续稳定的失效 、 故障或错误。在硬件中,永久性失效反映了不可恢复的物理改变。
间歇性:描述那些由于不稳定的硬件或变化着的硬件或软件状态所引起的 、 仅仅是偶然出现的故障或错误。
瞬时性:描述那些由于暂时的环境条件而引起的故障或错误。
一个故障可能由物理失效 、 不适当的系统设计 、 环境影响或系统的操作员所引起。永久性失效会导致永久性故障。间歇性故障可能由不稳定 、 临界稳定或不正确的设计所引起。环境条件会造成瞬时性故障。所有这些故障都可能引起错误。不正确的设计和操作员失误会直接引起错误。由硬件的物理条件,不正确的硬件或软件设计,或不稳定但重复出现的环境条件所引起的故障可能是可检测的,并且可以通过替换或重新设计来修复;然而,由于暂时的环境条件所引起的故障是不能修复的,因为其硬件本身实际上并没有损坏。瞬时和间歇故障已经成为系统中的一个主要错误源。
2 几种常用的故障模型
故障的表现形式千差万别,可以利用故障模型对千差万别的故障表现进行抽象。故障模型可以在系统的各个级别上建立。一般说来,故障模型建立的级别越低,进行故障处理的代价也越低,但故障模型复盖的故障也越少。如果在某一级别的故障模型不能包含故障的某些表现,则可以用更高一级别的模型来概括。下面介绍几种常用的故障模型。
2.1 逻辑级的故障模型
固定型故障指电路中元器件的输入或输出等线的逻辑固定为 0 或固定为1,如某线接地 、 电源短路或元件失效等都可能造成固定型故障。
短路故障是指一个元件的输出线的逻辑值恒等于输入线的逻辑值;
元件的开路故障是元件的输出线悬空,逻辑值可根据具体电路来决定。
桥接故障指两条不应相连的线连接在一起而发生的故障。
2.2 数据结构级的故障
故障在数据结构上的表现称为差错。常见的差错如下。
独立差错:一个故障的影响表现为使一个二进制位发生改变。
算术差错:一个故障的影响表现为使一个数据的值增加或减少 2i(i= 0 ,1,2, …)。
单向差错:一个故障的影响表现为使一个二进制向量中的某些位朝一个方向( 0 或1)改变。
2.3 软件故障和软件差错
软件故障是指软件设计过程造成的与设计说明的不一致的情况,软件故障在数据结构或程序输出中的表现称为软件差错。与硬件不同,软件不会因为环境压力而疲劳,也不会因为时间的推移而衰老。因此,软件故障只与设计有关。
常见的软件差错有以下几种。
非法转移:程序执行了说明中不存在的转移。
误转移:程序执行了尽管说明中存在,但依据当前控制数据不应进行的转移。
死循环:程序执行时间超过了规定界限。
空间溢出:程序使用的空间超过了规定的界限。
数据执行:指令计数器指向数据单元。
无理数据:程序输出的数据不合理。
2.4 系统级的故障模型
在系统级上的表现为功能错误,即系统输出与系统设计说明的不一致。如果系统输出无故障保护机构,则故障在系统级上的表现就会造成系统失效。
网友评论