OSN1500 PCXL由于主备主控文件不一致,导致上报NESOFT_MM告警的处理方法

发布时间:  2012-06-05 浏览次数:  142 下载次数:  0
问题描述
某局客户反映一台OSN1500设备更换83槽位PCXL单板后,上报NESOFT_MM告警。在网管查询主控板版本,都为5.36.30.15P01。
用:hbu-get-backup-info查询,返回 Backup-Info  : 0x00000002 ,主备同步失败。




NESOFT_MM参数为:0x02,0x03,0x00,0x08,0xFF



处理过程

原因一:主备板上当前运行的软件版本不一致。

原因二:主控板的主备区中(OFS1和OFS2)的软件版本不一致。

原因三:主备板上对板的对应目录下没有同名文件。


根因
N/A
解决方案

1、查询NESOFT_MM告警意义
根据OSN1500告警资料,发现该设备告警意义为主备主控板的NeSoft和Platform不一致。
2、用命令行查询两块主控的版本:

:sftm-get-testver:82
                 VERSION-INFORMATION(INCLUDING-PATCH-INFORMATION)                
        NESOFTNAME  VER               DATE      STATE     TEST-VERSION-INFO      
        NFS         5.36.30.15P01     20100220  Running   T02                    
        NSF1        5.36.30.15P01     20100220  active    T02                    
        NSF2        5.36.30.15P01     20100220  inactive  T02                    
        INI1        5.36.30.15P01     20091218  active    T02                    
        INI2        5.36.30.15P01     20091218  inactive  T02                    
        BIOS        08.09.04          20100716  inactive  T01                    
        ExtBIOS     09.09.04          20091218  active    T01                    
        Logic       (U1028)120                                                   
        LogicE01    (U1033)300                                                   
        DRV         V1.02             20090515  active    T04                    
  Total records :10                                                              

:sftm-get-testver:83                      
                 VERSION-INFORMATION(INCLUDING-PATCH-INFORMATION)                
        NESOFTNAME  VER               DATE      STATE     TEST-VERSION-INFO      
        NFS         5.36.30.15P01     20100220  Running   T02                    
        NSF1        5.36.30.15P01     20100220  active    T02                    
        NSF2        5.36.30.15P01     20100220  inactive  T02                    
        INI1        5.36.30.15P01     20091218  active    T02                    
        INI2        5.36.30.15P01     20091218  inactive  T02                    
        BIOS        08.09.03          20091218  inactive  T01                    
        ExtBIOS     09.09.04          20091218  active    T01                    
        Logic       (U1028)120                                                   
        LogicE01    (U1033)300                                                   
        DRV         V1.02             20090515  active    T04                    
  Total records :10                                                              

发现主备主控查询出来的软件版本是一致的,但基础BIOS不一致。查询版本配套表,基础BIOS应该为08.09.03。

3、使用
:sftm-show-dir:82,"/ofs1/hwx"
:sftm-show-dir:82,"/ofs2/hwx"
:sftm-show-dir:83,"/ofs1/hwx"
:sftm-show-dir:83,"/ofs2/hwx"
:sftm-show-dir:82,"/ofs1/fpga"
:sftm-show-dir:82,"/ofs2/fpga"
:sftm-show-dir:83,"/ofs1/fpga"
:sftm-show-dir:83,"/ofs2/fpga"
等命令分别查询主备主控的OSF1、OSF2目录下的hwx,fpga文件夹,对比发现82槽主主控/ofs2/hwx下比83槽备主控对应目录少了一个sccpkg.ini文件。查询版本配套表和其他正常的网元,发现该文件应该要存在。

问题定位:
82槽位主控osf2/hwx内文件与83槽位不一致。82槽位基础BIOS不是配套表要求版本。


处理方法:
使用Toolkit重新对82槽的PCXL软件包进行板级加载,然后再将基础BIOS降级到08.09.03。观察一段时间后,告警不再上报。问题解决。

 


建议与总结
1、NESOFT_MM告警并非只有主备主控版本不一致才上报,文件巡检时发现目录下文件不一样也会上报该告警,处理时需要仔细分析告警参数。

2、公司备件有可能和在网运行版本不一致,更换备件时需要注意。



END