美文网首页
故障处理流程总结

故障处理流程总结

作者: 洪荒之气 | 来源:发表于2021-05-26 18:03 被阅读0次

一、总体流程
1、故障突然发生
2、评估影响范围并进行通报
3、处理故障
(1) 启动应急方案处理
(2) 问题彻底处理
4、安抚客户
5、复盘总结
二、故障突然发生
由于我们没有故障预知的能力,或者说没有相应的措施去监控故障的发生,或者无法监控故障的发生,包括业务故障(资源不可使用)和系统故障(系统服务不能用等)。
三、评估故障发生的影响范围进行通报
故障发生了,涉及到哪些资源层面不能正常运行,以及相关联的是否也受到影响。最后要把影响范围和发生故障的原因理清楚通报给领导。
四、故障处理
故障比较重大,影响范围广,损失严重的话更加需要重视了。首先最重要的是应急处理,一定要有应急方案,应急方案来源于影响范围。通过应急方案把损失降到最低。彻底解决方案一般没有那么快出来的,要比较长的时间。同时需要整理出被影响的这部分资源的量,有多少。从而应急方案。
五、安抚用户
告知用户我们当前遇到的问题,以及处理进度,要怎么解决用户的问题,安抚用户,以及做好最坏打算之类的。
六、包括资源规范化、商务人员和上游沟通,并把沟通结果通知到后端支撑人员、盘查是否还有相同的资源也有可能收到影响是否存在相同的安全隐患,随时可能爆发故障。

相关文章

  • 故障处理流程总结

    一、总体流程1、故障突然发生2、评估影响范围并进行通报3、处理故障(1) 启动应急方案处理(2) 问题彻底处理4、...

  • 线上故障处理书目录

    线上故障处理之故障信息获取源 线上故障处理之处理流程 线上故障处理之故障后处理

  • Ceph心跳机制

    1. 心跳介绍 心跳是用于节点间检测对方是否故障的,以便及时发现故障节点进入相应的故障处理流程。 问题: 故障检测...

  • 仪表故障处理经验

    仪表故障处理经验 世界工业网络关键词:仪表维修理念、常见仪表故障处理总结 1结晶在现有装置中,加氢脱硫塔的有关仪表...

  • 动画理解

    传统 IO 阻塞 多路复用的select 多路复用的epoll 线程池原理 故障处理流程

  • 产品项目流程&故障处理

    第一课:产品项目流程 学习目标 1. 项目类型 2. 项目流程 3. 各项目在jira上的操作 4. 如何执行变更...

  • 异常处理流程总结

    cpu执行时发生并捕获异常,内核接过进程的控制权,开始内核态的异常处理。 内核异常处理结束,把控制权交ring3层...

  • Hadoop写文件时datanode发生故障的处理过程

    学习Hadoop写文件的流程时,看《Hadoop权威指南》中文版,在datenode发生故障时的处理那里,真的是看...

  • 故障处理

    解决方法:

  • 故障处理

    故障review前准备工作: 1、详细处理过程2、导致故障的原因3、故障影响范围、相关数据等4、故障的后续改进计划...

网友评论

      本文标题:故障处理流程总结

      本文链接:https://www.haomeiwen.com/subject/fpvksltx.html