最近一周,项目生产环境出了三次的大规模问题,是因为组内的一个同事。
第一次出错是因为没有考虑到现有的数据和旧的数据的兼容性,导致上线之后旧的用户用不了系统,因为数据匹配不上。
第二次出错是因为发现问题升级上去了,发现逻辑有点不对,导致大量的用户使用有问题,上线的那个功能处于瘫痪状态。
第三次升级是因为配置文件有个值没有更新,导致一个功能出现了问题。
出现了三次错误,还好我们的容灾做的还可以,出现问题马上切换了分区,造成的损失比较小,出现三次错误我们整个组的同事也跟着忙活了三次,很多人怨气横生。
至于为什么三次出错都没有在测试环境验证出来,是因为线上有多分区部署,测试环境没有,所以平常写代码的时候就需要考虑一些兼容性。
在灾后复盘中,那个同事却没有为自己的错误感到懊悔,依旧还是平常过着生活。我是很不喜欢这样的人,对自己所负责,所做的事没有一点责任心。
所谓的靠谱,于他人而言,你能让别人信任你,当有一些比较重要的事情,觉得交给你做比较放心。于自己而言,自己所作的事,自己要考虑好,尽量把事情做的圆满,不要让别人一而再再而三的对你失去信任。
网友评论