一、系统监控是什么
系统监控是一种针对相对稳定的产品,通过对数字性指标的收集和观察,自动、实时发现问题的有效手段。
系统监控是一个自动化的报警手段,能伴我们解放双手,只要我们给到对应的规则,不需要主动挖掘,自动的能帮助我们发现需求。
二、如何搭建监控体系
分为两步:
1.定义待监控指标:告诉机器要观察哪些指标
2.定义报警规则:告诉机器什么时候&如何通知我们
1.定义待监控指标
白盒直接反映了用户的体验,这是需要我们密切关注的。
黑盒部分的运转是否正常,间接影响了用户的体验。
案例1:百度搜索
案例2:滴滴出行
案例3:淘宝消息推送
系统监控类型
“策略监控并不一定直接影响用户的体验”
2.定义报警规则
触发报警的条件
根据产品历史数据得到正常波动区间,在正常区间外即发起报警给相关负责人。
报警方式
监控指标的重要程度和波动幅度决定了响应的及时性,我们根据响应的及时性来选择不同的报警方式:电话、短信、邮件。
如何界定正常波动区间?
如何评估指标重要程度?
两个衡量维度:对产品核心目标(用户体验、收入等)的影响面和影响程度。
四个分类:不重要、一般重要、重要、很重要
案例:今日头条的抓取策略
网友评论