大家好,我是楠哥。
交换机是个人和企业的常用设备,在使用过程中难免会出现各种问题,在出现问题时该如何进行故障的定位和判断呢?下面就以H3C的交换机为例,给大家讲讲设备的异常检查项。
设备指示灯状态是否正常
设备提供种类丰富的指示灯,通过查看指示灯的状态,可以判断该指示灯所指示对象的运行状态,如果发现指示灯状态异常,请及时记录故障信息,并进行故障定位与处理。
检查设备是否存在紧急或重要告警
display alarm 命令仅部分产品支持,其他产品可通过查看日志信息确认是否存在告警。如果部署有网管系统,也可以通过网管系统来检查设备是否存在告警,日志信息的详细介绍等。
检查设备的健康状态是否正常
登录设备后,可通过以下命令查看设备的健康状态:
查看告警信息确认是否存在告警
在日常维护中,对于 ERROR 级别的告警需要及时处理。登录设备后,执行 display alarm 命令查看设备是否存在级别为 ERROR 的告警信息。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息以核心交换机 S12500X-AF 系列交换机为例。
检查风扇的工作状态
查看在位的风扇的状态(State)是否均为 Normal。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息以接入交换机 S5560X-EI 系列交换机为例。
如果发现异常,请检查风扇模块是否插牢、风扇叶是否被卡住或灰尘较多。如果是上述原因,可通过热拔插风扇模块,清理风扇叶中的异物或灰尘等方式进行解决。如果不是上述原因,可尝试通过更换风扇模块的方式进行解决。
检查设备电源的信息
查看在位的电源模块的状态(State)是否均为 Normal。(不支持电源管理功能,以下显示信息以 接入交换机S5560X-EI 系列交换机为例)。
如果发现异常,请检查电源模块的开关是否闭合、电源线缆是否松动,最后可尝试通过更换电源模块解决故障。如果无法解决,请及时记录故障信息并寻求更高技术支持。
查看在位的电源模块的状态(State)是否均为 Normal(支持电源管理功能,以下回显信息以 S12500X-AF 系列交换机为例)。
如果发现异常,请检查电源模块的开关是否闭合、电源线缆是否松动,最后可尝试通过更换电源模块解决故障。
查看日志信息确认是否存在告警
登录设备后,执行 display logbuffer 命令查看日志缓冲区中记录的日志是否存在告警信息。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息还是以 S12500X-AF 系列交换机为例。
检查 CPU 的使用情况
查看设备的 CPU 使用率是否高于 80%。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息还是以 S12500X-AF 系列交换机为例。
如果发现 CPU 使用率过高,请观察一段时间(5~10 分钟),如果一直处于高使用率状态,请及时寻求技术支持。
检查内存的使用情况
查看设备的内存空闲率是否低于 20%。(不支持低端内存,以下回显信息以 S12500X-AF 系列交换机为例)。
如果内存空闲率在持续的一段时间内(一般为 30 分钟)过低,请及时联系代理商或 H3C 技术支持热线,寻求技术支持。
查看设备的低端内存空闲率是否低于 20%。(支持低端内存,以下回显信息以 S5560X-EI 系列交换机为例)。
如果低端内存空闲率在持续的一段时间内(一般为 30 分钟)过低,请及时寻求技术支持。
检查设备上温度传感器的温度信息
查看当前温度(Temperature)是否处于正常范围内。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息以 S12500X-AF 系列交换机为例。
如果发现异常,请检查机房温度是否正常、设备散热通道是否堵塞、设备的风扇模块是否工作正常,并采取相应的处理措施
检查各单板及子卡运行状态是否正常
框式设备
登录设备后,执行 display device 命令检查单板及子卡的状态,查看在位的各单板状态(Status)是否均为 Normal,子卡状态是否正常。不同设备回显信息可能存在差异,请以设备实际显示内容为准,以下回显信息以 S12500X-AF 系列交换机为例。
如果检查结果发现异常,可通过重新插拔单板或子卡的方式进行解决。如果无法解决,请及时记录故障信息,并联系技术支持。
好了,H3C 交换机设备维护常用的异常检查项,就简单介绍到这里,下一期我们再来关注一下交换机设备的信息收集方法及危险操作提示,有需要的小伙伴请关注我,咱们下期再见!
关注我,分享更多网络实用操作!感谢帮忙点赞分享,您的支持是我们最大的动力!
网友评论