第十五章 使用系统监视器 - 系统监控健康状态
基于发布到消息日志的通知,包括由IRIS
实例直接生成的系统警报以及由 System Monitor
和它的 Health Monitor
组件 System Monitor
在共享内存中的寄存器中维护一个总结整个系统健康状况的单一值。
在启动时,系统健康状态是根据在启动过程中发布到消息日志的系统(而不是系统监视器)警报的数量来设置的。系统监视器运行后,可以通过系统警报或系统监视器警报或警告来提升健康状态。自上次系统警报或系统监视器警报或警告发布后 30
分钟过去后,状态将清除到下一个较低级别。下表显示了如何确定系统健康状态。
State | Set at startup when ... | Set following startup when ... | Cleared to ... |
---|---|---|---|
GREEN (0) |
启动期间没有发布系统警报 | 自上次发布系统警报或系统监视器警报或警告以来已过去 30 分钟(如果状态为黄色)或 60 分钟(如果状态为红色) |
n/a |
YELLOW (1) |
启动期间最多发布四个系统警报 | 状态为绿色且 发布一个系统警报或发布了一个或多个系统监视器警报和/或警告,但警报不足以设置为红色,如下所示 | 上次系统警报或系统监视器警报或警告发布后 30 分钟后呈绿色 |
RED (2) |
启动期间发布五个或更多系统警报 | 状态为黄色并且发布了一个系统警报,或者状态为绿色或黄色,并且在 30 分钟内发布来自至少五个不同传感器的系统监视器警报或来自单个传感器的三个系统监视器警报 |
自上次系统警报或系统监视器警报或警告发布后 30 分钟已过去时为黄色 |
注意:当全局更新被阻止时,可能会出现第四种状态 HUNG
。具体来说,以下事件将状态更改为 HUNG
:
- 日志守护进程暂停超过
5
秒或冻结 - 设置开关
10
、11
、13
或14
中的任何一个 - 写入守护进程因任何原因停止或设置更新锁定标志超过
3
秒。 - 可用全局缓冲区(在数据库缓存中)的数量落入临界区并在那里停留超过
5
秒。
当健康状态变为 HUNG
时,原因将写入消息日志。
可以使用以下方法查看系统监视器健康状态:
-
^%SYSMONMGR
的“查看系统数据”菜单上的“查看系统运行状况”选项(不报告HUNG
)。 -
$SYSTEM.Monitor API
,可让直接访问系统状态。使用$SYSTEM.Monitor.State()
返回系统状态;另请参阅SetState
、Clear
、Alert
、GetAlerts
和ClearAlerts
方法。 -
iris list
和iris qlist
命令(在Windows
上不包括健康状态)。
注意:当系统监视器未运行时,系统监视器健康状态始终为绿色。
网友评论