故障现象:
两个站点间起Eth-trunk,由两条bi-di电路组成lag。其中一条突然发生翻滚,在1小时内重复多次up 和down,最后终于down了。
查看两端路由器日志,都有类似条目:
Nov xx 2019 xx:xx:xx.258 ar01.wan.lon %%01DRIVER/3/HWPORTDOWNREASON(l):CID=0x80fc0116;The physical status of the Port0 on Card0 in slot 2 changed to Down. The possible cause is: REMOTE_FAULT
因为查看端口disp optic 和disp int都能看到光模块信息,初步判断是路由器端口硬件故障,光模块应该是好的,需要工程师到现场做端口切换。
但实际情况是,在一端路由器上更换了端口,更换了光模块,故障依旧,端口仍然down/down。
再仔细检查了一下,光模块信息是这样的:
ETH0/2/0 up full 10G-20km-SFP+ 1330.00nm -3.25dBm -0.93dBm SingleMode SFP-10G-BX
ETH0/2/1 up full 10G-40km-SFP+ 1330.00nm -0.12dBm 1.50dBm SingleMode SFP-10G-BX40
原来当初现场工程师用错了光模块,一端用的是两个20km的光模块,另一端是两个40km的光模块,收发光强度都在容许范围,当时是通的。但安装的时候其中一个端口就有CRC error,现场工程师没有发现,运行一端时间后,莫名导致链路中断。
因为站点间距离约10km, 将一端40km的光模块更换成20km后恢复。
网友评论