RH2285 上电风扇狂转

发布时间:  2014-09-20 浏览次数:  496 下载次数:  0
问题描述
硬件配置: RH2285服务器 ;    软件配置: 无要求
问题现象: 
现场机器上电后,RH2285风扇狂转
告警信息
a、在BMC命令行下执行ipmctool  2 , 查看风扇速率显示为100%。
b、在BMC命令行下执行TOP命令,系统的bmcipmi.out和webs两个进程的CPU占用率一直较高。
处理过程
解决方案:可三选一,建议选择第一种方案。
1、 手工从本机的BMC的/data/mgnt/目录下拷贝出对应硬盘的rh2285_*disk_sdr.bin到/data/目录(如果是8盘的则拷贝rh2285_8disk_sdr.bin,12盘的则拷贝rh2285_12disk_sdr.bin),并根据机器类型改名为rh2285sdr.bin或者rh1285sdr.bin,然后在BMC命令行下执行reboot,复位BMC。
2、 用跳线帽强制把2285变成1285,然后上电,待操作系统上电后,再下电,把跳线帽去掉在上电即可。
(跳线帽的位置是J76从外往里数的第二个插口,用一个跳线帽插上即可,第三个插口为BMC与系统串口的切换开关,插上出BMC串口,否则出系统串口)
3、 命令行下重新升级BMC软件,可正常恢复(具体升级方法见升级指导书)。
举例如下:(假设是12盘的RH2285机器)
1、BMC的/data/mgnt/目录下有机架服务器的所有类型(4盘、8盘、12盘)的sdr文件。
2、假设我们的故障机器是12盘的RH2285机器,我们需要拷贝rh2285_12disk_sdr.bin文件到/data/目录下。
3、拷贝成功后,需要把/data/rh2285_12disk_sdr.bin 改名为rh2285sdr.bin。
4、复位BMC即可生效,风扇恢复正常。
根因
 从BMC 的命令行执行Top命令的情况来看,WEB与IPMI进程的交付一直在进行,应该是有什么异常导致。
根据以前类似问题的定位经验,应该是web获取sdr信息失败了。
在BMC命令行中执行:ls  –al  /data/ 命令后,发现rh2285sdr.bin或者rh1285sdr.bin的文件大小为零(注意:B031版本以后的sdr文件命令有所变化,变为sdr0.bin了)。
执行:ls  -al  /data/后发现rh2285sdr.bin大小为0.(RH2285的机器上)
执行:ls  -al  /data/后发现rh1285sdr.bin大小为0.(RH1285的机器上) 

定位结论:
sdr文件为空导致多个进程模块初始化失败,包括风扇模块,使风扇调速没有生效。
建议与总结
 风扇高速运转类问题,请先在BMC命令行下查看 ipmctool 2 和 ipmctool 3命令,看转速是多少。
然后看看BMC系统的健康状态(ipmcget -d healthevent),确定其他部件是否有告警。
如果以上方法修改成功,复位BMC一段时间后,风扇转速立即会降到正常水平(可以明显听的出来)。

END