起因:大面积机顶盒点播故障#
最怕遇到的问题就是大量用户的随机故障,偏偏又遇到了。一个分前端机房下属的大量用户报点播故障。一线报过来的故障现象又混乱,有说点不了,有说点播页面进不了,不一而足,于是更难判断故障。
定性:双向网故障#
先查IPQAM,看上去都好的。报省网查VOD平台,一如既往的石沉大海。Ping机顶盒IP有些通,有些不通,一会儿通,一会儿不通,最头疼的随机故障。
只好搬出FPing大招,对整个网段狂扫,数百IP只有个别地址羞羞答答的露个头,绝大多数都不可达。再扫几次,还是多数IP还是爱搭不理,更奇怪的是,能Ping通的IP每次都不一样,麻烦的随机故障。
排障:EOC猫环路#
去查网关,网关及以上路由一路畅通。网关侧貌似广播包有点大,可能是广播风暴。于是网关往下撸,PON口,ONU,真找到一个EOC上来的广播报文特别多。于是试着关了ONU,FPing马上如丝般顺快爽滑。打开ONU,终端马上又吭哧吭哧出不来。盖棺定论,罪魁祸首就是它了。
通知一线,找到用户家,EOC猫的两个口被一根网线环起来了。
总结:几个隐患#
- EOC猫两个口同VLAN
当年为了业务方便,营销口要求这么做,技术口没有坚持,所以留下隐患 - ONU广播包限流效果不好
ONU都做了广播包限流的,无奈设备就是限不住,厂家也给不出说法
网友评论