环回后TE链路持续up导致业务返回到原始路由并中断

发布时间:  2014-12-12 浏览次数:  73 下载次数:  1
问题描述

如图,一条ASON业务已经倒换,ASON业务原路有大量误码,导致原始路由不可用,站点A闪报CP_TEL_DOWN告警,同时还有业务不在原始路由告警CP_SER_NOT_OR。工程师在故障处理过程中对A战进行环回, 10分钟后业务中断。客户疑问:环回后业务为什么中断?

 

  

处理过程

链路误码导致TE链路不稳定,逐段环回定位误码源。排查光纤链路,取消环回。

根因

【Summary】

 

TE链路在UP的情况下光路软环回手段,智能软件对此无感知,保持UP状态。

 
【Details】

由于链路收和发两个方向误码情况不一样,CP_TEL_DOWN 有时只在一个方向闪报。当TE_链路UP的情况下,对端口做软件内环后,智能软件对此无感知,TE链路继续保持UP状态,智能平台认为链路状态可用,10分钟后业务自动返回到原始路由,而此时环回并未取消,导致业务中断。问题在于内环后TE 链路状态不变还是UP。

 

原理解释:

1、  智能TE链路连通性校验,只在链路告警消失时发起一次,通过J0确认链路两端单板信息核实校验,连通性校验成功后若无光路告警,不会再发起链路校验。

2、  其他智能消息或协议报文交互,通过ECC方式(D4~D12)进行,只要网元间有连通的光纤都可以走,并不一定走这条TE链路链。

以上实现机制核实符合业界标准。

 

实验室验证:

找一条正常的ASON链路,在TE链路UP的情况下对端口进行内环验证内环时TE链路状态:

TE链路正常,端口无环回:

#1-687:  XXX                                             ][][2014-12-09 17:46:51+03:00]>
:lmp-get-tel:12,0
                                           LMP_GET_TEL                                              
  LocalTelID  LocalBid  LocalPid  AdminStatus  OperStatus  NbrNodeID        RemoteTelID  Verify     
  0x6c00001e  12        1         AdminUp      up          172.16.36.2      0x6c000044   enable     
  Total records :1                                                                                  

#1-687:XXX                                              ][][2014-12-09 17:46:51+03:00]>
:cfg-get-loop:12,1
                                    LOOP-STATE                                   
                               Bid   Pid   LOOP-MODE                             
                               12    1     noloop                                
  Total records :1                                                                

对端口进行内环:                                                                                 

#1-687:XXX                                               ][][2014-12-09 17:47:15+03:00]>
:cfg-set-loop:12,1,inloop

#1-687:XXX                                               ][][2014-12-09 17:47:35+03:00]>
:cfg-get-loop:12,1
                                    LOOP-STATE                                   
                               Bid   Pid   LOOP-MODE                             
                               12    1     inloop                                
  Total records :1                                                               

#1-687:XXX                                               ][][2014-12-09 17:47:38+03:00]>
                                                             EVENT_ALM_AUTO_REPORT --687                                                       
  NUM         BID   EID                               SEVERITY    STATE       TIME                           PARA1  PARA2  PARA3  PARA4  PARA5 
  3412337     12    LOOP_ALM                          MN          start       2014-12-09 17:47:36+03:00      0x01   0x00   0x01   0x00   0x00  

内环后查询端口状态,发现TE链路还是UP状态。

#1-687:XXX                                               ][][2014-12-09 17:47:40+03:00]>
:lmp-get-tel:12,0
                                           LMP_GET_TEL                                              
  LocalTelID  LocalBid  LocalPid  AdminStatus  OperStatus  NbrNodeID        RemoteTelID  Verify     
  0x6c00001e  12        1         AdminUp      up          172.16.36.2      0x6c000044   enable     
  Total records :1                                                                                  

解决方案

无,以上实现机制核实符合业界标准。

建议与总结

后续维护建议:

  1. 在光路正常的情况下,不随意进行软环回,环回对静态业务以及智能业务在环回期间都会造成损伤;
  2. 在光路异常的情况下,在进行软环回时,建议环回及时取消,时间不要超过5分钟(华为设备环回默认5分钟取消),以免10分钟一些保护倒换返回或智能业务返回。

END