对于一套已完成建设并投入使用的技术系统,确保其安全可靠的运行就是后期运维的重中之重。目标无外乎,不断的发现问题,进而去排除隐患,提升系统可用性。
首先看如何不断的发现问题,有效的巡检任务清单可以有助于全面的检查问题,清单不仅包含规范化的巡检条目模板,而且包含临时性的紧急巡检条目,辅以相应的激励机制,确保及时准确的完成整个巡检清单,一旦发现问题,需要在第一时间将问题现场转换为待处理问题工单,及时传递到下一个环节。
再看如何排除隐患,对于模板化的巡检条目,一旦发现问题产生工单,该工单必将与模板中相对应的处置手段和经验汇总相关联,技术人员在专家知识和以往经验的基础上做出自我判断和决定,直至问题有效解决,问题处理的过程和结果将作为经验条目纳入专业知识库,不断的丰富经验知识库,为未来的问题处理提供参考。
根据发现问题、形成工单、有效解决构建的运维经验总结,对于重复出现的问题,寻找合适的解决方案,不断优化技术系统,持续完善巡检清单。利用巡检清单管理、工单协同管理、运维知识管理、绩效激励管理的有效结合,构建技术运维闭环管理模式。
后续文章
如感兴趣,请与grt-dengqi@139.com联系。
网友评论