转载自华为服务支持的Linux网卡性能问题
故障现象
现象一:PCIe Speed和Width与网卡规格不符合。
现象二:网卡出现降速。
现象三:网卡性能无法达到线速。
现象四:ethtool -S ethx查询有pause帧。
问题影响
影响业务性能,网络吞吐量不足。
可能原因
1) 硬件故障
2) 网卡FW问题
3) CPU、内存能力不足
4) 网卡本身性能问题受限
解决措施
1. 升级网卡FW/Driver到最新版本,检查问题是否解决(为什么上来就升级版本?没看出来定位思路)。
是,处理完毕。
否,执行2.使用lspci -s <BDF> -vvvx...。
2. 使用lspci -s <BDF> -vvvxxx检查网卡PCIe链接的Speed和Width,观察是否存在PCIe链路异常(什么场景下属于异常?捂脸)。
是,执行3.插拔网卡,检查问题是否解决。。
否,执行5.使用ethtool ethX观察网卡Spee...。
3. 插拔网卡,检查问题是否解决(是网卡灯闪不闪吗?)。
是,处理完毕。
否,执行4.交叉验证主板(Riser卡)和网卡,确认是主...。
4. 交叉验证主板(Riser卡)和网卡,确认是主板(Riser卡)故障还是网卡故障,更换故障主板(Riser卡)/网卡,检查问题是否解决。
是,处理完毕。
否,联系华为技术支持。
5. 使用ethtool ethX观察网卡Speed,确认网卡是否存在异常。
是,联系华为技术支持。
否,执行6.通过修改网卡队列、绑核、Ring Buffe...。
6. 通过修改网卡队列、绑核、Ring Buffer等进行性能调优,检查问题是否解决。
是,处理完毕。
否、执行7.检查是否由于CPU能力不足,内存通道数量少导...。
7. 检查是否由于CPU能力不足,内存通道数量少导致网卡性能不足。
是,建议更换性能更好的CPU和增加内存条。
否,联系华为技术支持。
个人一点经验
网卡出现降速,有可能是交换机上相应的网卡限速了,要一步一步查找。
之前Window下网卡是百兆,交换机上是万兆,要降速才行。这种问题有可能是开局或维护时出现配置错误,商用局一般见不到。
网友评论