“丢了一只马蹄铁,折了一匹战马;折了一匹战马,损了一位国王;损了一位国王,输了一场战争;输了一场战争,亡了一个帝国。”这首著名的英国民谣,讲述的是1485年,英国国王查理三世在一场重要的战争中,因为马蹄上少钉了一个钉子的马掌掉了,战马摔倒,从马上重重摔下,没等他再次抓住缰绳,受惊的战马就跳起来逃走了。一见国王倒下,士兵们纷纷乱做一团,各自为了性命逃之夭夭。最终导致后来查理三世被杀,国家随即灭亡。
因为时代的发展,这种少了一个马蹄钉,导致国王被杀,一个国家被毁的事情不可能再发生。但类似的这样因为小失误带来大灾难的例子却实在是太多了。美国作者克里斯.克利尔菲尔德、安德拉斯.蒂尔克斯写作的这本书《崩溃》,就讲述了在现代社会中,虽然科技在不断地发展,但金融、地铁、航空这些高级而复杂的系统中,还是会因为一些小小的失误而发生重大事故的例子。
小失误也可带来大灾难,《崩溃》教你怎样防止系统崩溃作为作者之一的克里斯,最开始是证券与金融衍生品交易员,他在工作中目睹了雷曼兄弟银行的倒闭和全球股市的动荡。而安德拉什则一直从事各种重大灾难事件的研究。他们通过事故报告、学术研究资料和对各种人物的访问,发现在当今社会中,政府、企业的组织系统越来越复杂,虽然这些系统也建立了完善的安保设施,但是仍不时会有重大问题的发生。而其中的主要原因,往往不是大型的工程失误,而是一些小失误或者一连串小失误的组合。
比如在2012年,美国华尔街最大的交易公司之一的骑士资本的崩溃,就源于一个软件的小故障。而美国三里岛核电站在20世纪70年代发生过的一次重大事故,事故的原因也是一连串小失误的组合:供水系统问题、卡住的阀门和模棱两可的指示。
为什么小小的失误会造成可怕的后果呢?
这是由于系统的复杂性和紧密耦合造成的。在所有的系统中,系统的复杂性增加了失误的机会,而紧密耦合则放大了失误的后果。
对于一个复杂系统来说,在系统内部它的各个部分以错综复杂的方式相互联系,又以非常隐蔽的方式相互产生影响。有些东西表面上看上去没有关系,但它们之间可能会有间接的联系。也有一些点可能联系到很多个点,如果其中某个点出现问题,它能够联系的地方都可能会出问题。
比如在一个公司里面,组织架构的层级越多,可能出现问题的环节就越多。
紧密耦合会让系统没有弹性,一个部分出现的失误容易影响到其他的部分,根本没有缓冲的余地。在紧密耦合的系统中,所有的一切必须做到精确无误,大体上正确都不行,而且需要按照特定的顺序和时间框架,一般不存在做错了再返工这个选择。做事情只能按一种方法去做,换成别的方法去做就没有好的效果。
好比玩多米诺骨牌游戏,骨牌以适当的距离摆放,通过启动点的触发,全部倒向预先设定好的方向。如果某个点的骨牌摆放出现了失误,就宣告这一次的游戏失败。
那怎样对待这些小的失误,避免以后酿成灾难性事件呢?
我们无法从根本上改变大多数系统,但我们可以改变我们的活动方式。与其成为事后诸葛亮,不如通过事前检验、保护系统的薄弱部分、从小失误中找到经验,去尽量防止小问题变成大问题,小事故变成大灾难,也可以通过在系统中加上松动的空间,从而减少失误对系统的影响。
事前检验,防患于未然。
事前检验的基础是心理学家称之为“未来的后见之明”的概念,即通过想象一个事件已经发生而产生的后见之明。在系统运行之前,根据需要达到的目的,尽可能多地设想会遇到的问题,并提出解决的方法,并且把内容记录下来,用来指导系统的运行。
就像平时我们做一道菜,如果能先备好菜谱,预先把所有需要的原材料和调味料都准备好,并且先学习一下做的顺序,就可以避免在做的过程中因为手忙脚乱而倒致意外情况的发生。
保护系统的薄弱部分。
任何看起来高大上的系统、组织或项目中并不全是铁板一块,它总有一部分是脆弱的。如果能知道薄弱的部分在哪里,即使我们不知道会发生什么样的事故和伤害,但是我们可以把这一部分重点加强,也可以避免一些灾难的发生。
在二战后期,美国B17轰炸机空袭德国,有很多中弹没有回来,设计师就研究在容易被命中的地方加固更厚的装甲。统计发现,飞回来的飞机翅膀中弹特别多,机舱弹孔反而没多少。按照直觉推测,应该是加固机翼,可这逻辑对么?当然不对,事实上,恰恰应当加固机舱和发动机装甲。因为“飞回来的飞机”翅膀弹孔多,正说明打中翅膀了飞机还能回来,可打中机舱飞机就没救了,直接坠毁,根本不给你数弹孔的机会。后来的实践证实了这一点,他们加固了机舱装甲,果然,飞机坠毁率下降了。
对系统的薄弱部分做好防护,就可以大幅减少因为薄弱部分出现问题,而对系统造成的伤害。
从较小的失败中吸取教训,避免大的失败。
复杂系统的一个基本特点就是,我们无法通过单纯地思考它们的情况来找到所有的问题。由于系统之间复杂与罕见的相互作用,有些错误根本不能够被预见,但是在系统崩溃之前,它们会发出一些警告的信号。比如一些小失误、反常现象和侥幸脱险事件。
我们要重视这些异常现象,学会从这些小过失和未遂事故中获得经验。
第一步是通过收集未遂事故的报告和检查错误事件来收集数据;
第二步重视所有的异常现象,并且改正这些问题;
第三步是继续深入发掘问题的本质,找到问题出现的根本原因;
最后一步,在实践中检验我们在应对警示信号时给出的答案是否确实有效。
给系统加上松动空间,让事情留有余地。
有时候,我们面对的都是非常复杂的系统,系统的运行会带来什么后果,这对我们是个未知数。但是如果把系统的运行周期安排得长一点,系统运行的速度慢一些,就不致于因为赶时间而变得手忙脚乱,自然可以减少忙中出错的情况发生。而慢下来能让我们有时间和能力去应对意外情况的发生。
系统之间的联系松动一点,则可以让系统在面对灾难时有了缓冲的余地。
比如减少车祸的密诀就一个字:“慢”。
时代的发展,科技的进步,让我们的系统变得越来越复杂。我们不可能预见到所有的一切,但是我们千万不要忽视系统给我们的提示。要知道“千里之堤,毁于蚁穴”,亚马逊雨林一只蝴蝶偶尔振动两下翅膀,也许两周后就会引起美国得克萨斯州的一场龙卷风。
网友评论