美文网首页
告警管理

告警管理

作者: 千沙qiansha | 来源:发表于2020-11-10 16:48 被阅读0次

    将CMDB系统与Prometheus连接,实现批量部署配置文件,批量管理告警信息等

    架构

    用户操作场景

    实例属主

    关注点:出问题了么?哪里出问题了?是什么问题?

    1.收到告警后,能通过页面针对不合理的阈值进行单个
    批量修改,在告警消息上能针对
    单个阈值进行修改。
    2.对应用进行分组,并针对该组制定告警规则。
    3.告警发送通道的自助式配置。
    4.维护窗口进行告警的单个
    批量静默。

    监控人员

    关注点:直观知道出问题了么?哪里出问题了?通知给谁?是否已解决?

    1.告警大屏上展示告警的关键信息,如应用、IP、维护者、重要性。
    2.告警数据的分析,哪些应用或实例告警频率高。
    3.告警的个例、批量修改,修改的记录有留痕。

    管理人员

    关注点:监控点是否全覆盖、告警阈值是否设置合理、是否有告警、告警有无及时处理;

    哪里问题多?什么问题?。

    平台建设者

    关注点:告警平台稳定性,操作简易性,不漏发消息,消息准时发出。

    1.平台下发数据是否正常,涉及规则、应用实例是否按既定规则推送。
    2.规则变更后的生效时间,目前15分钟。
    3.告警发生差异,触发阈值的告警数及送达告警数。
    4.告警消息轨迹及时延,从产生告警及送达对应的通道。

    功能

    1.针对硬件、网络、系统、应用(部分业务)四类采集器进行自助式告警规则、告警模板、应用分组配置。
    2.自助式进行告警规则启用、禁用、静默。
    3.告警大盘展现,不同级别不同颜色。
    4.告警通知:钉钉@到人,接入电话、短信告警。
    5.简化告警模板。
    6.告警渠道管理。
    7.支持用户订阅告警消息。
    8.支持延迟通知设置。
    9.行为日志记录:规则变更、阈值变更、静默变更。
    10.告警消息上点击操作数据能同步到后端并处理。

    告警流程

    告警模块.png

    相关文章

      网友评论

          本文标题:告警管理

          本文链接:https://www.haomeiwen.com/subject/vasjbktx.html