1 什么是zabbix
1.1 zabbix介绍
-
zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。
-
Zabbix 软件能够监控众多网络参数和服务器的健康度、完整性。Zabbix 使用灵活的告警机制,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。
-
Zabbix支持主动轮询和被动捕获。Zabbix所有的报告、统计信息和配置参数都可以通过基于Web的前端页面进行访问。基于Web的前端页面可以确保您从任何方面评估您的网络状态和服务器的健康性。适当的配置后,Zabbix可以在IT基础架构监控方面扮演重要的角色。对于只有少量服务器的小型组织和拥有大量服务器的大型公司也同样如此
1.2 zabbix功能
Zabbix 是一个高度成熟完善的网络监控解决方案,一个的软件包中包含了多种功能。
-
可用性和性能检查;
-
支持 SNMP(包括主动轮询和被动捕获)、IPMI、JMX、VMware 监控;
-
自定义检查;
-
按照自定义的时间间隔采集需要的数据;
-
通过 Server/Proxy 和 Agents 来执行数据采集
- 您可以参考后端数据库定义非常灵活的告警阈值,即触发器
-
可以根据递增计划、接收者、媒介类型自定义发送告警通知;
-
使用宏变量可以使告警通知变得更加高效有用;
-
自动操作包含远程执行命令。
- 使用内置图形功能可以将监控项实时绘制成图形。
- Zabbix可以追踪模拟鼠标在 Web 网站上的点击操作,来检查 Web 网站的功能和响应时间。
-
可以组合多个监控项到单个视图中,创建自定义图表;
-
网络拓扑图;
-
以仪表盘样式展示自定义聚合图形和幻灯片演示;
-
报表;
-
监控资源的更高层次展示视图(业务视图)。
-
存储在数据库中的数据;
-
历史配置;
-
内置数据管理机制(housekeeping)。
-
将被监控设备添加为主机;
-
主机一旦添加到数据库中,就会采集数据用于监控;
-
将模板用于监控设备。
-
模板中分组检查;
-
模板可以关联模板,继承已关联模板的属性。
-
自动发现网络设备;
-
Zabbix Agent 发现设备后自动注册;
-
自动发现文件系统、网络接口和 SNMP OIDs 值。
-
基于 PHP 的 Web 前端;
-
可以从任何地方访问;
-
您可以定制自己的操作方式;
-
您可以通过审计日志来查看你的操作。
-
安全的用户身份验证;
-
指定的用户只能查看指定的权限范围内的视图。
1.3 zabbix概述
1.3.1 zabbix工作架构
imgZabbix监控组件主要包括:Zabbix Server、Zabbix Proxy、Zabbix Agent;其中Zabbix Server包括:Web GUI、Database、Zabbix Server
-
abbix Server:负责接收agent发送的报告信息的核心组件,所有配置,统计数据及操作数据均由其组织进行;
-
Database:用户存储所有配置信息,以及存储由Zabbix Server收集到的数据;
-
Web GUI:Zabbix的interface接口,通常与Server运行在同一台主机上;
-
Zabbix Proxy:常用于分布监控环境中,代理Server收集部分被监控的监控数据并统一发往Server端;(通常大于500台主机需要使用)
-
Zabbix Agent:部署在被监控主机上,负责收集本地数据发往Server端或Proxy端
1.3.2 zabbix 的监控原理
Zabbix Agentd安装在被监控的主机上,Zabbix Agent负责定期收集客户端本地各项数据,并发送至Zabbix Server端,Zabbix Server收到数据,将数据存储到数据库中,用户基于Zabbix WEB可以看到数据在前端展现图像。当Zabbix监控某个具体的项目,该项目会设置一个触发器阈值,当被监控的指标超过该触发器设定的阈值,会进行一些必要的动作,动作包括:发送信息(邮件、微信、短信)、发送命令(SHELL 命令、Reboot、Restart、Install等)。
1.3.3 zabbix监控方式
-
Zabbix分布式监控系统监控客户端的方式常见有三种:Agent、SNMP、IPMI。
-
Agent:Zabbix可以基于自身zabbix_agent客户端插件监控OS的状态,例如CPU、内存、硬盘、网卡、文件等。
-
SNMP:Zabbix通过SNMP协议监控网络设备或windows主机等。通过设定SNMP的参数将相关监控数据传送至服务端,交换机、防火墙等网络设备一般都支持SNMP协议。
-
IPMI(Intelligent Platform Management Interface):智能平台管理接口,即主要应用于设备的物理特性,包括:温度、电压、电扇工作状态,电源供应以及机箱入侵等。IPMI最大的优势在于无论OS的开机还是关机状态下,只要接通电源就可以实现对服务器的监控。
1.3.4 zabbix 常用术语
-
host(主机):要监控的网络设备,可由IP或DNS名称指定
-
host group(主机):主机的逻辑容器,可以包含主机和模板,但同一个组内的主机和模板不能互相链接;主机组通常在给用户或用户组指派监控权限时使用
-
item(监控项):一个特定监控指标的相关数据,这些数据来自于被监控对象;item是zabbix进行数据收集的核心,将没有数据;相对某监控对象来说,每个item都有“key”进行标识
-
tigger(触发器):一个表达式,用于评估某监控对象的某特定item内所接受到的数据是否在合理范围内,即阈值;接受到的数据大于阀值时,触发器状态从OK转变成Problem,当数据量再次回归合理范围时,器其状态将从Problem转换会OK
-
event(事件):即发生的一个值得关注的时间,例如触发器的状态转变,新的agent或重新上线的agent的自动注册等
-
action(动作):指对于特定事件事先定义的处理方法,通过包含操作(如发通知)和条件(何时执行操作)
-
escalation(报警升级):发送警报或执行远程命令的自定义方案,如每隔5min发送一次警报,共发送5次等
-
media(媒介):发送通知的手段和通道,如Email、Jabber或SMS
-
notification(通知):通过选定的媒介向用户发送有关某事件的信息
-
remote command(远程命令):预定义的命令,可在被监控主机处于某个特定条件下时自行执行
-
template(模板):用于快速定义被监控主机的预设条目集合,通常包含了item、trigger、graph、screen、application以及low-level discovery rule;模板可以直接链接至单个主机
-
application(应用):一组item的集合
-
web scennaro(web场景):用于检测web站点可用性的一个或多个http请求
-
frontend(前端):zabbix的web接口
网友评论