1、监控的堆栈:
业务逻辑
应用程序
操作系统
2、Prometheus 是 Pull的方式
3、USE方法:针对每一个资源,检查使用率、饱和度和错误。
4、GOOGLE的四个黄金指标:
- 延迟:服务请求所花费的时间,区分失败和成功请求。
- 流量:每秒HTTP的请求数或DB的事务数
- 错误:请求失败的速率
- 饱和度:
5、警报和通知: - 哪些问题需要通知
- 谁需要被告知
- 如何告知
- 多久告知一次
- 何时停止告知
6、可视化:Prometheus+Grafana
7、Prometheus架构
image.png
网友评论