美文网首页
关于自动化辅助故障分析的思路

关于自动化辅助故障分析的思路

作者: 有点胖的瘦子 | 来源:发表于2022-06-24 07:12 被阅读0次

一、现在场景的思路

针对故障的定向分析

在监控报警发出后,人员查看告警时间对应的指标,日志,Trace,变更事件等信息,分析可能存在的异常,在这个时候,主要是依赖人员的经验进行分析。

人为的全面分析

做完定向分析后,为了以防万一,一般还得对系统做一次全面分析,最少要把关键指标看一遍,异常日志模型工具也得用一下。这其实挺费时间的。

二、存在的问题:

存在的问题:系统分析经验很难复制

首先是比较慢,毕竟要查看4类信息,还是去查询到,这个最少需要好几分钟的时间。

另外,虽然套路相同,工具也有,但是每个系统的情况不同,导致日志、指标、Trace都不样,所以对于一套系统的分析经验,很难复制到另一套系统上。

存在的问题:人员经验难以复制

对于某个系统,如果经常分析,人员能力确实可以提速,但是如果不是自己负责的系统,就很难有高速分析的效果,只能慢慢来。

存在的问题:历史经验与案例很难沉淀

故障发生不是你想发生就发生,得看缘分。这么好的故障案例,不留存成组织案例,太可惜了,但是人为排障往往就容易出现,解决完问题就万事大吉的情况,很少有人能够从组织资产角度进行沉淀与整理。

当然就算沉淀了,下次排障时能否及时运用也是一个挑战。

相关文章

  • 关于自动化辅助故障分析的思路

    一、现在场景的思路 针对故障的定向分析 在监控报警发出后,人员查看告警时间对应的指标,日志,Trace,变更事件等...

  • 故障自愈:解决运维的主要矛盾才能AIOps

    蓝鲸作者故障自愈产品经理 以产品设计理念剖析企业建设故障自动化处理方案的思路 人工处理告警,一直是运维心中的痛。大...

  • 关于自动化Python+Selenium的自动化测试思路——之线

    关于自动化Python+Selenium的自动化测试思路——之线性脚本篇 经过最近的学习虫师的Python的自动化...

  • iOS 工程自动化 - Ruby 入门到辅助脚本编写

    iOS 工程自动化 - Ruby 入门到辅助脚本编写 iOS 工程自动化 - Ruby 入门到辅助脚本编写

  • 关于分析思路

    近期聊到一个老生常谈的题目,活跃用户下降了,怎么分析? 这个在互联网企业数据分析中,经常遇到,活跃用户是代表着用户...

  • JVM heap dump分析

    前言 在故障定位(尤其是out of memory)和性能分析的时候,经常会用到一些文件辅助我们排除代码问题...

  • 汽车故障码的分析方法

    汽车故障码的分析 故障码分析就是在读取故障码的基础上,结合其他的检测结果对所读取的故障码进行比较分析从而做出故障判...

  • 手机维修之音频电路

    主要分析总结音频电路故障和维修思路。 音频主要包括小音频(铃声IC)和大音频,需要具体分析如下。 一、大音频电路如...

  • 2020-10-27

    诊断故障要有思路,很多故障报的故障码都不是故障问题所在,找出根源,解决问题…

  • (3)数据挖掘与数据化运营

    数据挖掘的指导思想是以业务为核心,思路为重点,挖掘技术为辅助的。 一、常见数据分析类型 (1)用户特征分析 通过对...

网友评论

      本文标题:关于自动化辅助故障分析的思路

      本文链接:https://www.haomeiwen.com/subject/aqmpvrtx.html