PTN3900主控板1+1保护场景下SCA更换过程总结

发布时间:  2012-06-04 浏览次数:  126 下载次数:  0
问题描述
PTN 3900 V1R2C00版本,配置了主备主控保护,30槽位TN82SCA单板故障,上报BD_STATUS告警,需要完成30槽位SCA板更换。




处理过程

1、在30槽位插入TN82SCA备件,观察BD_STATUS告警结束,随后上报COMMUN_FAIL告警,告警参数为01 00 03 ff ff,告警持续时间约为2分钟后结束。
2、待30-SCA的COMMUN_FAIL 告警结束后,网元上报同步失败告警SYNC_FAIL,查询主备主控备份状态为0x00000001,表示主备之间正在握手,是个暂态。
:hbu-get-backup-info
  Backup-Info  : 0x00000001   
3、查询30-SCA软件版本信息,提示返回超时,30-SCA上电约10分钟后能正常查询其软件版本信息,与29-SCA主主控不一致。
:sftm-get-nesoftver:30,file;
failed! cmd:0x02dc error:0x0080 CMD_EXECUTE_TIMEOUT  
:sftm-get-nesoftver:30,file;
                               VERSION-INFORMATION                               
               NESOFTNAME        VER               DATE      STATE               
               NSF1              5.59.02.51        20110228  active              
               NSF2              5.59.02.51        20110228  inactive            
               NeSoft(D)         5.59.02.51        20110228                      
               Platform          5.00.23.491       20110218                      
               INI1              5.59.02.51        20110228  active              
               INI2              5.59.02.51        20110228  inactive            
               BIOS              8.24.41           20100425  inactive            
               ExtBIOS           9.24.61           20110217  active              
               PCB               TN82SCA VER.B                                   
                   Logic             (U1062)120 
4、观察30-SCA上电约30分钟后,检查发现同步失败告警SYNC_FAIL依然存在,反复查询备份状态仍为0x00000001,偶尔查询结果为0x00000000。
5、根据指导书介绍约30分钟可以完成软件和数据同步,经研发指导查询软件状态,30-SCA的状态为“UNSTABLE”,研发建议继续等待约30分钟后再次确认。
:sftm-rtrv-state:swdl;
                        SFTM_RTVE_STATE                                          
     CPY_TYPE              MAIN_STATE            SUB_STATE                       
     swdl                  NORMAL                UNSTABLE    
6、观察30-SCA上电约53分钟后,30-SCA完成软件同步,查询主备数据同步状态为0x00000002。
7、观察30-SCA上电约56分钟后,再次上报COMMUN_FAIL告警,告警参数仍为01 00 03 ff ff,告警持续约4分钟后消失,查询主控复位记录,发现30-SCA发生了一次软复位,咨询研发该复位记录表示软件包匹配完成后的一次主动复位。
No.015:  2012-05-05 16:54:21   BOARD=30   TYPE=0xf0000010    SOFTTYPE=001   
8、随后检查同步失败告警SYNC_FAIL结束,查询此时主备主控备份状态为0x00000003,表示主备之间的批量备份成功完成。
:hbu-get-backup-info
  Backup-Info  : 0x00000003  
9、约2分钟后观察30-SCA再次上报COMMUN_FAIL告警,告警参数仍为01 00 03 ff ff,告警持续约3分钟后消失,查询主控复位记录,发现30-SCA又发生了一次软复位,咨询研发该复位记录表示同步nodeid后的一次主动复位。
No.016:  2012-05-05 17:02:53   BOARD=30   TYPE=0xf0000010    SOFTTYPE=002
10、30-SCA软复位起来后,查询主备主控备份状态为0x00000002,约3分钟后进入0x00000003状态。
11、确认主备主控数据同步完成,使用网管进行主控主控保护倒换测试验证,每次主备倒换后,系统会进行一次主备数据同步过程,因此两次倒换之间最好能间隔10分钟左右。


根因

TN82SCA单板故障,需要更换新的SCA单板保证网元主控板的1+1保护。

解决方案

按照产品手册中的更换步骤,依次完成SCA单板的更换操作。

建议与总结

1、主控1+1保护配置场景主控板更换,一般是进行备用主控的更换,整个软件版本和配置数据同步过程大概需要约1个小时,与产品手册中描述的30分钟相差较大,已经和研发确认,产品手册后续将进行优化更改,更换过程中需要注意。
2、新更换的备用SCA在完成软件包匹配后、同步nodeid后均会发生一次软复位,更换过程中请了解。
3、新更换的备用SCA在完成软件版本和配置数据同步前,切勿采用拔插主用SCA方式倒换,否则可能造成配置数据丢失,最好能结合命令行确认一下主备主控板的备份状态为0x00000003,然后在进行主备倒换。





END