存储高温掉电后的系统开工失败的处理

发布时间:  2015-08-14 浏览次数:  250 下载次数:  0
问题描述
系统高温掉电,重新上电后开工失败,系统进入minisystem
告警信息

系统上电失败,进入minisystem

showsystrace 2发现失败在NotifyUpgradeSyncFw这一步

处理过程

1、  前期系统下电是因为高温产生;

event事件里面有记录高温掉电

2015-07-12 14:57:27    0xf0ce0009    Critical    2015-07-13 16:30:45    The temperature of Engine (ID ENG0, SN 210235853310EB000018) greatly exceeds the upper limit, and the system is going to shut down automatically

若小系统下未收集到event日志,可查看Poweroff日志确认系统产生二级高温掉电

<5>[891275839][15000002f1e39][INFO][CLS_FRU: Two level hightemp, goto power lost.][SYS] [fillFRUFaultTaskActions,87][TP_SysCtrlTPool]

 

2、  查看主控上电时的日志,确认硬盘框处于高温休眠状态;

[2015-07-12 17:49:00][75009][1500000300926][ERR][Fail to get enclosure address, local state of enclosure(inner id 1) is sleep.][EMP][DEV_GetFrameAddrInfoByInnerId,3262][upgrade_atom]

根因

硬盘框仍处于高温休眠状态,导致系统上电失败

解决方案

待硬盘框温度恢复正常后,重新上电设备恢复。

建议与总结

系统重新上电成功后,检测客户业务是否恢复。

END