更换备交叉板导致业务受损案例分析

发布时间:  2014-12-25 浏览次数:  71 下载次数:  0
问题描述

xx局点在更换备交叉板过程中,业务闪断

处理过程

一、操作过程还原

1、2014-12-18 07:02:44 拔出原故障10-XCS单板并插入新单板82XCS,网元上报W_OFFLINE、BD_STATUS和TR_LOC告警

---W_OFFLINE告警表示拉手条打开


---单板离位告警


----此TR_LOC告警表示10-XCS单板在位坏(此次上报的原因是打开拉手条导致,因为打开拉手条会置单板坏)

 

2、2014-12-18 07:04:55 和 2014-12-18 07:14:18 两个时间段内突然上报TR_LOC告警


----此TR_LOC告警上报期间没有进行人为操作。是10-XCS单板启动后网元其他处理板检测到10槽位XCS在位异常,上报此告警

 

3、2014-12-18 07:07:51 ~ 2014-12-18 07:25:03 期间,1槽位和11槽位单板上报心跳报文检测异常告警,且此时间段内部分业务受影响


 

二、告警分析

1、TR_LOC告警(02 20)表示10号XCS单板在位坏,判断交叉板在位坏有三个触发条件:交叉板坏上报HARD_BAD告警、交叉板拉手条打开(W_OFFLINE告警)和交叉板没有插紧(无告警)

2、BUS_ERR告警(0x50 0x00)表示1槽位和11槽位单板单板心跳报文异常

 

三、业务受影响的初步分析
现网10槽位单板在机框没有插紧,部分信号处于不稳定状态,此情况下容易导致单板内部电压不稳并进一步导致时钟抖动,时钟抖动会导致SC芯片(交叉板的业务处理芯片)在对报文处理时出现异常(报文采样出现错误),最终导致业务报文受影响。

根因
新插入的10槽位XCS机框没有插紧,部分信号处于不稳定状态,此情况下容易导致单板内部电压不稳并进一步导致时钟抖动,时钟抖动会导致SC芯片(交叉板的业务处理芯片)在对报文处理时出现异常(报文采样出现错误),最终导致业务报文受影响。
解决方案

1、现网拔掉 新插入的备XCS板,业务恢复

2、重新更换备XCS板,并插好

建议与总结

插入单板正常方式

1、佩戴好防静电腕带
2、两手捏住单板面板上的扳手,将其向两侧扳开
3、将单板沿上下导槽轻推入相应槽位,并且使单板拉手条上下扳手的凹槽对准子架的上下边沿,稍用力推单板的拉手条,直到单板基本插入母板插座

4、观察到插头与插座的位置完全对应时,再将拉手条上、下扳手向里扣,将单板完全插入

END