美文网首页
《进化—运维技术变革与实践探索》摘要

《进化—运维技术变革与实践探索》摘要

作者: 商未央 | 来源:发表于2018-08-18 15:23 被阅读78次

运维需要编码能力

大多数运维人员不具备代码开发能力,并不是自身的能力问题。很多情况下都是因为不够自信,对写代码心存畏惧,担心自己写不好,所以一开始就把自己给限制住了。

给当前运维人员建议:

1、提升编码能力

2、提升产品意识(不要成为被动响应型)

3、提升技术运营意识

(如何根据需求,把承载了标准化和规范体系的工具平台真正落地应用起来。同时在落地过程中,收集问题和数据进行分析,再回到产品设计和需求实现的流程中进行改进,形成良性循环。)

故障管理

永远不要将注意力放在故障本身上,一定要把注意力放到故障背后的技术和管理问题上。因为我们一旦关注到故障本身,就容易抓着和故障相关的责任人不放,会给责任人带来很大的负面压力以及负面效应。

借用SRE的一句话:理解一个系统应该如何工作并不能使人成为专家,要去调查系统为何不能正常工作才行。

作为管理者,要问自己,若下次出现类似问题,怎么样才能更加地发现问题,更快地恢复业务,即使这一次的故障应对已经做的非常好,下次是否可以有进一步的改进。要关注全局的改进:例如是不是考虑开发更完善的发布系统,减少人为操作;是不是应该做整体的稳定性平台建设,包括限流降级、开关预案、强弱依赖、容量评估、全链路跟踪系统,以及建设后如何一步一步落地;故障预案和演练应该如何被有效地组织起来,等。

强调两点:第一,管理员面对故障,一定要先自我反省。第二,强调用技术解决问题,而不是单纯地靠增加管理流程和检查节点。可以在技术解决之前,用管理手段来辅助。

自问:我在工作中是否能做到积极主动,具备主人翁意识,敢于承担更多更大的责任?我在工作中是否能够不断取得成果,在团队中或跟团队一起做出较大的贡献,取得较大的业绩?

全文结构:

运维本质——运维体系建设——配置管理——运维组织架构及模式——持续交付——稳定性保障——故障管理——云运维技术选型——CDN——运维人员成长之路——运维与安全

//运维相关的书其实很少,之前看过一本,里面竟然写的是各种软件的安装,我也是醉了。相对而言,这本要好些,但总体感觉四个字——还不够爽!

相关文章

网友评论

      本文标题:《进化—运维技术变革与实践探索》摘要

      本文链接:https://www.haomeiwen.com/subject/ifhgbftx.html