前段时间在排查一个网络瞬断问题,现总结如下。
1、带宽占用超限问题
网络流量超过设置的带宽或者运营商的带宽,那么在数据包可能存在丢弃问题。可以通过工具抓包来定量分析查看带宽占用情况。如果整个交换机流量问题,那么就需要配置镜像端口来查看了。
Wireshark在 统计 --> I/O图表 可以对网络实时分析。默认为 packets/s,wireshark非常棒,可以选择多种分析方法(下面有列出,一共有10种),可以切换至bytes统计带宽。
也可以基于python来实现自己的在工具,Python Tkinter与psutil完成网络速度监视。
2、端口以太网工作模式
以太网口的两端工作模式(10M半双工、10M全双工、100M半双工、100M全双工、自协商)必须设置一致,否则就会出现流量一大速度变慢的问题。大多数设备以太网口的默认的出厂设置都是自协商,端口根据并且达到速度最高的工作水平连接另一端设备的连接速度和双工的模式,协商过程如下FAQ-以太网自协商的详细过程 。
3、交换机限制
为了保护CPU,设备会对上送CPU的协议报文进行限速。当上送的协议报文速率超过相应的CPCAR值时,超过的部分就会被丢弃,这时就很容易造成业务运行不正常。此项问题可以通过dis logbuffer来查看日志定位问题。

4、防火墙策略
防火墙策略就很简单了,是不是设置了某项策略,丢弃了某些包。可以通过管理网页查看策略信息以及策略命中次数来查看。
5、网线、网卡和路由器等硬件故障
硬件故障导致的问题采用排除法来查找,逐一更换。笔者在实际中遇到过网线质量问题导致的数据瞬断的问题,通过更换网线后恢复正常。
6、网络风暴、病毒等网络安全问题
交换机、路由器等设备的日志查看,wireshark抓包定位查看,终端设备部署杀毒软件来避免此类问题。
网友评论