完整的Zabbix监控流程:
Agentd需要安装到被监控的主机上,它负责定期收集各项数据,并发送到zabbix server端,zabbix server将数据存储到数据库中,zabbix web根据数据在前端进行展现和绘图,数据采集数据存储数据展示和分析设置阀值报警/操作;
Agentd收集数据分为主动和被动两种模式:
- 主动:Agent请求server获取主动的监控项列表,并主动将监控项内需要检测的数据提交给server/proxy,zabbix首先向ServerActive配置的IP请求获取active items,获取并提交active tiems数据值server或者proxy。
- 被动(默认):server向agent请求获取监控项的数据,agent返回数据,Server打开一个TCP连接,Server发送请求agent.ping,Agent接收到请求并且响应,Server处理接收到的数据。
本次安装选择的是主动模式,主要考虑为:
当zabbix-server监控主机过多时候,由于server端去搜集信息,zabbix会出现严重的性能问题,比如:
1. 当监控端到一个量级的时候,web操作界面很卡,容易出现502
2. 图层断裂
3. 开启的进程太多,即使item数量减少,以后加一定量的机器也会出现问题
所以主要往2个优化方面考虑:
1. 添加proxy节点或者node模式做分布式监控
2. 调整agentd为主动模式
相关术语:
主机:主机是整个监控的关键,所有的监控想都是围绕主机进行部署,是以服务器的对象进行监控。
主机组:相关主机的分组,便于有关联主机的整合
模版:可以进行套娃操作的神器,例如有2台Linux的主机,对Linux的性能CPU,内存,磁盘等都可以同一种监控的模板来进行监控,每个主机都按照系统类型分配一个对应的Template。
操作:是发送报警的关键选项,需要在此选项配置监控的对象,发送警告的对象以及发送的时间等。
用户:在接收报警的对象,可以是邮件,短信和微信等。
新增主机需要添加应用集,监控项,触发器或者是整个模板,当主机上的触发器被触发,会通过操作中的报警媒介类型进行报警预告,报警对象是在用户报警媒介所设置
主动模式配置参考:
https://www.zhouzhifei.com/?p=153
http://www.mrliangqi.com/1322.html
https://www.jianshu.com/p/c0c2f09048aa
网友评论