美文网首页
Linux网卡性能问题分析思路

Linux网卡性能问题分析思路

作者: robot_test_boy | 来源:发表于2022-08-09 06:30 被阅读0次

转载自华为服务支持的Linux网卡性能问题

故障现象

现象一:PCIe Speed和Width与网卡规格不符合。

现象二:网卡出现降速。

现象三:网卡性能无法达到线速。

现象四:ethtool -S ethx查询有pause帧

问题影响

影响业务性能,网络吞吐量不足。

可能原因

1) 硬件故障

2) 网卡FW问题

3) CPU、内存能力不足

4) 网卡本身性能问题受限

解决措施

1. 升级网卡FW/Driver到最新版本,检查问题是否解决(为什么上来就升级版本?没看出来定位思路)。

是,处理完毕。

否,执行2.使用lspci -s <BDF> -vvvx...。

2. 使用lspci -s <BDF> -vvvxxx检查网卡PCIe链接的Speed和Width,观察是否存在PCIe链路异常(什么场景下属于异常?捂脸)。

是,执行3.插拔网卡,检查问题是否解决。。

否,执行5.使用ethtool ethX观察网卡Spee...。

3. 插拔网卡,检查问题是否解决(是网卡灯闪不闪吗?)。

是,处理完毕。

否,执行4.交叉验证主板(Riser卡)和网卡,确认是主...。

4. 交叉验证主板(Riser卡)和网卡,确认是主板(Riser卡)故障还是网卡故障,更换故障主板(Riser卡)/网卡,检查问题是否解决。

是,处理完毕。

否,联系华为技术支持。

5. 使用ethtool ethX观察网卡Speed,确认网卡是否存在异常。

是,联系华为技术支持。

否,执行6.通过修改网卡队列、绑核、Ring Buffe...。

6. 通过修改网卡队列、绑核、Ring Buffer等进行性能调优,检查问题是否解决。

是,处理完毕。

否、执行7.检查是否由于CPU能力不足,内存通道数量少导...。

7. 检查是否由于CPU能力不足,内存通道数量少导致网卡性能不足。

是,建议更换性能更好的CPU和增加内存条。

否,联系华为技术支持。

个人一点经验

网卡出现降速,有可能是交换机上相应的网卡限速了,要一步一步查找。

之前Window下网卡是百兆,交换机上是万兆,要降速才行。这种问题有可能是开局或维护时出现配置错误,商用局一般见不到。

相关文章

网友评论

      本文标题:Linux网卡性能问题分析思路

      本文链接:https://www.haomeiwen.com/subject/isrewrtx.html