美文网首页@IT·互联网
从德国守门员出击开始,说说阿里云故障公告

从德国守门员出击开始,说说阿里云故障公告

作者: 袁旭程 | 来源:发表于2018-06-28 11:37 被阅读369次

    1

    昨晚的世界杯比赛,卫冕冠军德国队,0:2输给了韩国队,小组垫底出局。 韩国队在93分钟进球后,德国队发起了最后的进攻。门将诺伊尔出击到了中场附近。结果被韩国队防守反击,在96分钟再入一球,锁定败局

    2

    守门员本来作为最后一道防线, 一般来说是永远站在门前的门神。前锋诺伊尔这一次出击,导致韩国队奔袭射了空门,很多人都认为这是守门员的失误

    3

    守门员真的是这场比赛的没有翻盘机会的罪魁吗? 并不是。现代足球场上的每一个失球,每一个进球,都不是一个人所能控制的。这是一个团队的游戏。现代足球,战术的价值越来越高, 个人的影响力越来越低。强如梅球王,被多人盯防的时候,也很难发挥出色,更不要说被轰成筛子的自家球门

    4

    什么是一个团队,就是当问题出来之后,每个人都会去反思和承担问题,而不是都指向其他人,说,这是他的锅。然后把自己摘得干干净净。这是一个团队,每一环都至关重要

    5

    很多团队都分了各种职能,目的,是为了更好的合作,明确业务的边界。 但是这样会有问题。一个是阶段特别明显,接力棒需要一个部门一个部门的传递。 高耸入云的部门墙, 让效率大打折扣。二是出事之后,责任容易被最接近问题的人承担,所谓的直接负责人

    6

    昨天出事的,不止是德国队,还有国内阿里云。时长约半小时,多项服务不可用,导致了大量用户的网站异常。问题修复后,“令人感动”的公告很快出来, “我们在运维上的一个操作失误,导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题” ,这个锅,似曾相识地扣在了运维头上

    7

    软件开发的流程好似击鼓传花。 先是用户或者经理有了业务需求,产品经理接受和分析需求,用户体验设计师设计流程,开发负责人设计实现,开发人员实现需求,测试人员验证实现和需求的一致性, 运维人员将内容搬运到生产环境, 运营人员在线上应对各种各样的变化

    8

    开发流程中的花,好比足球赛场上的球。当对手的球,突破了前锋,突破了中锋,突破了后卫,最后突破了门将的手的时候, 责任真的是门将的吗? 是因为门将的反应速度不够快速?动作技术不标准?手不够长? 都不是。问题从赛前的派兵布阵就开始了。 没有选择有突破能力的前锋,没能在前两场比赛中取得胜利,压力到了最后一刻, 真的不能怪德国守门员的出击

    9

    软件开发过程中, bug就像一朵含苞待放的炸弹, 穿过产品经理业务流程验证, 穿过了开发流程,穿过了测试流程,最后,被部署在生产环境上绽放。这朵花,不是运维一个人,将其放置在生产环境上

    10

    在公告中,描述的业务变更是理所应当的,没有类似变更风险考虑不周的描述。“这一功能在测试环境验证中并未发生问题”,表明这个问题和测试人员没有关系。受牵连的多个系统,每个系统自身的健壮性和容错能力,大家也不关心。最后,运维人员成功背锅,大家一起来反思“自动化运维技术” 和“发布验证流程”吧~

    要换守门员吗

    P.S. 写完之后,感觉能上阿里云的bug一定是bug中的里奥梅西 d(`・∀・)b

    相关文章

      网友评论

        本文标题:从德国守门员出击开始,说说阿里云故障公告

        本文链接:https://www.haomeiwen.com/subject/wclgyftx.html