S7706下行Eth-trunk口两物理成员端口错接不同接入设备导致业务中断

发布时间:  2017-03-08 浏览次数:  238 下载次数:  0
问题描述

收到用户报障某一楼层有线无线业务全部中断。

版本信息:

S7706V200R008C00SPC500+V200R008SPH008

S5700V200R008C00SPC500

组网架构:

目标架构:


目前架构:


XX局点网络新建项目,一重要区域楼宇共5层,根据客户要求及入驻时间安排首先实施配置了1~3F的业务,然后将4F/5F接入设备数据配置完成,上架至楼层接入弱电间,但未跳纤。

根据规划接入全部双链路捆绑上行连接楼宇汇聚S7706设备,但因故未能正常实施,目前未单链路连接,但在配置中仍按规划配置为Eth-trunk口,并将规划的端口加入Eth-trunk口。

某日该区域用户反馈3F有线/无线网络业务全部中断,无法正常连接网络访问业务。


处理过程

接到用户反馈后到达现场进行排查定位,业务恢复。

思路如下:

,只是3F网络业务中断,其他楼层业务正常,基本可以确定故障点在汇聚设备以下,初步怀疑设备掉电宕机或者物理链路宕掉了。

二,在汇聚设备上ping 3F接入设备管理地址发现ping不通,业务也不通;再查看lldp发现有3F设备的邻居信息。



三,根据邻居中的信息排查端口配置。


四,根据邻居信息,端口配置及对应关系发现S7706下行Eth-trunk口两物理成员端口错接不同设备导致业务瘫痪

五,为了尽快恢复业务,将G0/0/2口(连接4F接入,未有人员入驻)shutdown,业务恢复正常,区域AP上线,用户正常接入。


根因

硬件施工人员在跳4F光纤链路时将光纤接错导致3F网络业务中断,管理不通。



建议与总结

在实施前将施工要求,规范,方法同其他相关人员拉奇,尽可能避免因为信息不对称导致网络业务出现故障。

案例中的配置是根据当时场景在eNSP中复现的,在真实场景中客户反馈网络出现故障,首要的重点就是恢复业务,要根据现象冷静的根据分析原因,一环扣一环的进行推理,不能在面对客户的压力及现场复杂的环境下丢失排查问题的思路,有时可能就是一个很小不起眼的错误导致网络故障,业务不通。

END