自动化监控Zabbix之邮件报警

作者: EC君_王磊 | 来源:发表于2016-10-19 14:11 被阅读2763次
    EC君

    闲白

    Hello大家好我是EC君
    今天为大家介绍zabbix监控中邮件报警的配置方法
    如果我们已经配置好zabbix-server的各种监控项和触发器,为的当然是提供有效的报警了。除了在web页面进行实时查看,zabbix还有多种的报警方式供我们使用,最常常见的报警方式有:邮件、短信、微信和各种提供AIP的客户端。这样我们就可以在家吃着火锅唱着歌,而业务发生故障时也可以第一时间做出反应了。
    当然,配置好报警级别和优化报警项目是一件长期工作,zabbix上线之初最常见问题就是产生大量垃圾报警,真正重要的报警被海量垃圾警告所淹没,重要故障根本没有被我们看到,未来有时间我会给大家介绍告警调优方法和思路。
    下面开始今天的主题,配置邮件告警。


    OK:不要干,就是怂。Here we go!

    </br>


    创建思路

    首先大家可以看告警发送的步骤图,我们就知道我们应该配置那些项目来实现邮件报警了。


    告警发送过程
    • 1.事件发生
    • 2.故障已经发生
    • 3.进行条件判断是否在维护等
    • 4.触发动作,如执行命令或发生邮件报警
    • 5.发送告警到对应人员或组
    • 6.选择相应告警媒介进行发送
    • 7.发成发送告警信息

    步骤就这么多,理清思路我们配置其实只有3大项:

    • 1.动作
    • 2.报警媒介类型
    • 3.用户报警媒介
      配置完成就搞定了,现在我们开始配置。

    动作

    首先点击配置→动作→创建动作。
    注意看图右上角选择触发器

    创建动作

    下一步配置动作和传递的默认信息
    我们需要配置:

    • 名称:
    Action-Email
    
    • 默认接收人:
    故障{TRIGGER.STATUS},服务器:{HOSTNAME1}发生: {TRIGGER.NAME}故障!
    
    • 默认信息:
    告警主机:{HOSTNAME1}
    告警时间:{EVENT.DATE} {EVENT.TIME}
    告警等级:{TRIGGER.SEVERITY}
    告警信息:{TRIGGER.NAME}
    告警项目:{TRIGGER.KEY1}
    问题详情:{ITEM.NAME}:{ITEM.VALUE}
    当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
    事件ID:{EVENT.ID}
    
    • 恢复信息打钩
    • 恢复主题:
    恢复{TRIGGER.STATUS}, 服务器:{HOSTNAME1}: {TRIGGER.NAME}已恢复!
    
    • 恢复信息:
    告警主机:{HOSTNAME1}
    告警时间:{EVENT.DATE} {EVENT.TIME}
    告警等级:{TRIGGER.SEVERITY}
    告警信息:{TRIGGER.NAME}
    告警项目:{TRIGGER.KEY1}
    问题详情:{ITEM.NAME}:{ITEM.VALUE}
    当前状态:{TRIGGER.STATUS}:{ITEM.VALUE1}
    事件ID:{EVENT.ID}
    
    • 启用打钩


      配置动作

    配置条件

    条件就是我们逻辑图中判断的过程,我这里简单的设置了,两个条件:

    • A.维护状态在非维护
    • B.触发器等于有问题
      当触发器存在问题时,且服务器未在维护状态,触发后面的操作。


      配置条件

    配置操作

    • 1.配置动作持续时间
    • 2.配置具体步骤:这里可以设置第1-3步触发报警发送邮件给管理员,第4步直接发送告警邮件给经理,可以实现故障升级的概念。
    • 3.步骤持续时间,这里设置的是60秒,每隔60秒会发送一次邮件
    • 4.选择操作类型为:发送消息
    • 5.选择发送到指定的用户组
    • 6.选择发送到指定的用户
    • 7.选择示警媒介为电子邮件报警(电子邮件报警是我在后边报警媒介类型中创建的,为了让大家理清创建思路,你在配置时没有这个选项可以在配置好报警媒介类型后再进行配置)
    • 8.选择事件确认,如果界面点击了事件确认,将不发送报警邮件。
    配置动作

    配置报警媒介类型

    选择管理→报警媒介类型→点击创建

    配置报警媒介类型

    填写以下信息:

    • 名称:自己起名
    • 类型:选择电子邮件
    • SMTP服务器:填写自己对应smtp服务器信息
    • SMTP服务器端口:默认25
    • SMTP HELO:HELO是普通SMTP,不带身份验证。填写域名
    • SMTP电邮:填写自己邮箱
    • 安全链接:支持各种方式,我这里选择的
    • 认证:选择普通密码
    • 用户名称:填写自己邮箱
    • 密码:填写密码


      填写媒介信息

    用户报警媒介

    点击管理→用户,选择Admin用户,我这里就将邮件发送给Admin用户。这里多用户可以灵活配置。


    选择用户

    点击报警媒介→添加


    点击添加

    可选择相应分类进行报警

    • 类型:电子邮件报警
    • 收件人:选择自己需要的收件地址
    • 当启用时:我这里配置的1-7天0点到24点,也就是7X24收告警邮件。
    • 选择故障分类:我这里配置的是选取。如果生产中只有重大故障通知特定领导,可以在这里配置。
      点击启用、添加。


      配置报警媒介

    故障模拟

    现在我们停掉一个agent测试下邮件是否可以发送


    关闭某个agent

    可以看到已经发送邮件成功了
    我们设置了60秒发送一次,共发送三次,1个已经发送,1个正在发送。


    实验成果

    可以再看下邮件发送状态


    邮件发送状态

    Zabbix邮件发送告警就为大家介绍到这里了,下次会为大家介绍如何通过微信进行告警发送。


    END.

    OK今天就为大家介绍这么多了。
    我是EC君,如果感觉我写的东西还能凑合看的话,请帮忙点个关注!点个喜欢吧!
    也可以点击作者信息,扫描微信二维码关注我的个人微信公众号。
    你的鼓励将是我们共同进步的源泉。

    相关文章

      网友评论

        本文标题:自动化监控Zabbix之邮件报警

        本文链接:https://www.haomeiwen.com/subject/oprvyttx.html