整体页面
需求
- 监控现状:基于open-falcon部署的哗啦啦监控系统,支持基础监控(io、cpu、mem等监控),借助falcon的plugin和方便的push数据结构的方式,能够很方便的实现业务的监控。同时开发了一个java的falcon插件(falcon数据监控实现方法),能够很容易的集成到代码,将业务数据push到falcon里边,进行相应的监控。
- 之前也总结了一个wiki(哗啦啦监控报警现状)
- 同时能看到open-falcon更多的是面向运维来使用的,维度是基于服务器主机,对于研发来说使用稍微有点不方便,所以考虑基于open-falcon,包装一层服务树,完成哗啦啦的监控系统
- 看上图 "整体页面" 的展示,整个监控系统的入口已服务树为基础,将服务相关的监控+Metrics展示出来。同时自己设置报警的规则,通过log-Agent进行日志的采集规则过滤。
设计
open-falcon提供了丰富的开放接口,包括采集数据、获取历史数据、添加报警信息等等,同时数据格式是标准的rrd的时序数据格式。所以后端的数据核心和报警都基于open-falcon来实现。
可能遇到和继续解决的问题:
- 服务树的关联
- docker+k8s+Log-Agent的关联
- 备注
网友评论