网卡丢包
故障现象
通过ifconfig查看网口有dropped计数。
问题影响
影响网卡性能。
影响客户业务,可能导致客户业务中断。
可能原因
1) 协议层丢包,与网卡本身没有关系。
2) 超过网卡线速,网卡无法正常处理如此多的报文。
3) 网卡配置问题,未将网卡性能调至最优。
4) 网络中充斥大量非业务报文,导致网卡出现丢包。
解决措施
1) 将网卡FW、Driver升级到最新iDriver版本,检查问题是否解决。
是,问题结束。
否,执行2.使用ethtool -S ethX查看网口e...。
2. 使用ethtool -S ethX查看网口ethX统计,查看是否有rx_dropped。
是,执行3.网卡是否达到线速。
否,执行4.非rx_drops是网卡协议层丢包,一般是业...。
3. 网卡是否达到线速。
是,网卡处理能力限制,可以打开网卡及链路中交换机的流控功能,减少网卡丢包。
否,执行5.检查网卡配置,查看是否由于内存通道太少、队列...。
4. 非rx_drops是网卡协议层丢包,一般是业务无法处理的报文,可以通过查看是否存在相当的广播报文、组播报文,同时网卡没有打开对应的MULTICAST、ALLMULTI、BROADCAST等,进行相关排查丢包是否属于正常现象。
是,处理完毕。
否,联系华为技术支持。
5. 检查网卡配置,查看是否由于内存通道太少、队列、buffer、NUMA等原因导致网卡性能上不去,进行对应性能调优后观察是否还存在丢包。
是,联系华为技术支持。
否,处理完毕。
网卡出现丢包,同时发现网络中存在大量LLDP报文
可能原因
网卡异常发送了大量的lldp报文,造成网络风暴,影响网卡收发包
解决措施
1) 交换板lldp enable ,交换板CPU接管LLDP报文,检查问题是否解决。
是,处理完毕。
否,执行4.联系华为技术支持。。
2. 交换机执行undo bpdu bridge enable,检查问题是否解决。
是,处理完毕。
否,执行4.联系华为技术支持。。
3. 网卡关闭dcbx/LLDP功能,检查问题是否解决。
是,处理完毕。
否,执行4.联系华为技术支持。。
网卡VF没有接收到业务报文
可能原因
网卡配置了LACP,而线缆连接了错误的端口。
网卡没有打开全组播或者没有配置正确的组播地址。
解决措施
1) 检查网卡是否配置了LACP。
是,执行2.检查线缆是否插入正确的交换机端口。
否,执行3.使用ifconfig查看网卡是否打开了MUL...。
2. 检查线缆是否插入正确的交换机端口。
是,执行3.使用ifconfig查看网卡是否打开了MUL...。
否,重新将线缆插入正确的交换机端口。
3. 使用ifconfig查看网卡是否打开了MULTICAST/ALLMULTI/BROADCAST,使用ifconfig ethX multicast/allmulti/broadcast打开网卡对应功能,检查问题是否解决。
是,处理完毕。
否,联系华为技术支持。
网卡业务报文不通(防火墙和业务类型)
可能原因
网卡配置没有接收对应的报文。
解决措施
1) 确认业务报文类型,检查防火墙是否阻止了网卡接发报文,检查问题是否解决。
是,处理完毕。
否,执行2.确认业务报文类型,使用ifconfig et...。
2) 确认业务报文类型,使用ifconfig ethX观察网卡是否配置接收对应报文,如:MULTICAST、ALLMULTI、BROADCAST,使用ifconfig ethX multicast/allmulti/ broadcast 打开网卡对应功能,检查问题是否解决。
是,处理完毕。
否,联系华为技术支持。
个人一点经验
网卡业务报文不通还有可能是网络有可能是单通,可以对端互ping下是否通,是否有丢包。
网友评论