10GWAN由于没有配置端口DOWN延时导致传输倒换时端口瞬断引起BGP邻居重建

发布时间:  2012-07-27 浏览次数:  170 下载次数:  5
问题描述
某局点反馈NE40E最近常出现与NE5000E的BGP邻居由ESTABLISHED变  IDLE,但立即又恢复。
组网:NE40E---波分传输---NE5000E
告警信息
Aug 31 2009 22:41:30 CR01-NE40E %%01TAD/4/IFDOWN(l):-Slot=1; Owing to the alarm message(s), GigabitEthernet1/0/0 went Down. (AlarmType=lais, lof, oof, pais)
Aug 31 2009 22:40:30 CR01-NE40E %%01BGP/3/STATE_CHG_UPDOWN(l): The status of the peer 111.208.14.25 changed from ESTABLISHED to IDLE. (BgpAddressFamily=Public)
Aug 31 2009 22:41:30 CR01-NE40E %%01TAD/4/IFUP(l):-Slot=1; Owing to the alarm message(s), GigabitEthernet1/0/0 went Up. (AlarmType=lof)
处理过程
1、仔细检查NE40E上log日志,发现在产生以上告警的同时有10GWAN端口UP/DOWN现象,且时间很快;
2、由于日志没有其他异常记录,且端口DOWN时AlarmType=lais, lof, oof, pais,判断应该是瞬间没有收到光或传输其他原因导致端口底层模块产生了告警导致端口DOWN;
3、同时检查端口,没有配置端口DOWN延时;
4、为了更进一步证实上面的判断,协调局方检查传输告警,果然在NE40E端口DOWN时有倒换告警;
5、由此判断是传输倒换(一般在50ms以内)瞬时中断导致NE40E产生了LOS告警从而将端口DOWN;
6、于是在端口配置端口延时DOWN和RDI告警敏感,再协调传输做倒换测试,端口不会DOWN,问题解决。
       transmission-alarm down lais lof los lrdi pais prdi
       transmission-alarm holdoff-timer 100
根因

ATM、POS、10GWAN等接口缺省情况下只使能了LAIS、LOF和LOS这3种告警触发接口接收端DOWN。本故障中由于10GWAN接口下没有配置接口DOWN延时,这样因传输倒换导致的链路短暂中断,路由器受此影响,会产生LOS、LOF或其他AIS告警,致使接口接收端DOWN(但发送方向还正常发光)。

传输倒换时间一般都在50ms之内,因此路由器上可以配置接口DOWN延时100ms保证传输倒换时路由器接口保持UP,而不影响路由协议的正常运行。另外,为了防止互联设备一端UP、一端DOWN的情况,还需要使能RDI告警敏感,这样若接收方向发生中断时接口会DOWN,RDI告警触发发送方向停止发光,让互联两端设备的接口都down掉。

建议与总结
遇到ATM、POS、10GWAN等接口,附件的配置将作为规范配置。

END