故障分为P1-4级
P1
系统无法访问
有10%以上的查询无结果,或者无法查询
booking失效比率超过5%
P2
5%以上的查询无结果
1%以上的booking失效
重要wrapper获取率为0,且没有发现
P3
2%以上的查询无结果
0..5%的booking失效
其他影响服务质量的故障
P4
其他故障,不影响线上业务
可用率计算
A = 1-(T(P1) + T(P2) * 0.5 + T(P3) * 0.25)/T
T为计算时段的总时间
P1-2的故障需要Ops会同相关产品开发部门进行故障review
P1-3的故障,如不是监控系统发现,需要review监控系统
所有故障的故障报告,和故障review应该在故障发生后24小时内完成
网友评论