因为任务冲突导致PTN3900补丁包加载失败

发布时间:  2012-10-30 浏览次数:  78 下载次数:  0
问题描述
K客户进行PTN3900-8补丁升级,创建完补丁包任务,进行补丁加载失败,提示信息如下:
 Load Patch operation failed, failure reason: the NE status is incorrect, possible course: 1. the patch package is already loaded to NE, Rollback is required before loading the patch again; 2, the upgrade of the software package is not find, 3. The NE is in an unable state”
升级前的主机版本为V100R002C05SPC300.
补丁版本号为V100R002C05SPH303.






处理过程

分析DC log日志发现,在进行补丁包加载的时间点,网元的软件包状态为非稳定态,如下:
[23:08:44.625024 176-40645] send:
:sftm-rtrv-state:swdl
[23:08:44.641070 176-40645] recv:
SFTM_RTVE_STATE
CPY_TYPE              MAIN_STATE            SUB_STATE
swdl                            NORMAL                   UNSTABLE
Total records :1
注:补丁包加载或软件加载的前提条件是网元的软件包状态必须为稳定态(Normal),因此,这个是补丁包加载出错的直接原因。
经过确认,导致软件包状态为非稳定态的原因有如下4个:
触发条件1:主、备单板之间的数据库同步。
触发条件2:新安装物理单板后的软件包自动匹配。
触发条件3:网元主机软件升级或者打补丁。
触发条件4:网元软件包状态自检。




根因
网元软件包状态进入非稳定态的原因为网元软件包自检触发,现场需待自检完成后重新进行补丁包加载
解决方案
1、因为打补丁当天客户已经封网,因此,前3种原因经过和客户确认均不存在。
     1)排除主备板数据库同步的可能性。
     2)排除新安装单板上线触发的软件自动匹配。
     3)排除网元进行其他软件升级的可能。
2、与产品专家再次确认,触发网元软件包进入非稳定态的因素只有以上提到的4种情况。
3、综合以上判断,基本确定现场PTN网元软件包状态进入非稳定态的原因为网元软件包自检触发,现场待自检完成后重新进行补丁包加载,操作成功。


建议与总结
1、网元软件包状态自检每24小时定期执行。
2、自检正常情况下不会产生Log文件或告警。
3、网元软件包自检过程不会影响网元的正常运行,但是在自检过程中,网元的软件包状态会变为非稳定态(normal-unstable)。



END