桌面云产品下电再上电后导致个别刀片BMC静态IP丢失的问题处理

发布时间:  2012-12-26 浏览次数:  90 下载次数:  0
问题描述
H省某局,开局版本为V100R002C00SPC200,由于客户需求对系统下电,下电后再进行系统上电后有三个刀片的BMC地址不能够PING通,但业务是正常的。通过MM模块登陆查看该三个刀片发现地址已经变为DHCP状态。
告警信息
无。
处理过程
1  检查网络配置,没有异常,并且该服务器(E6000)9片刀片中只有3个不能PING通并且与其它刀片配置无区别。
2  复位有问题的三个刀片,复位后故障没有消失。
3  登陆E6000的MM模块,在网络配置中察看刀片的网络配置,发现有问题的三个刀片状态为DHCP状态,在客户端直接  PING这三个DHCP的地址能够PING通,也能够直接登录。
4  通过MM模块WEB界面,直接修改三个问题刀片的BMC地址,由DHCP状态修改为静态,地址修改为当初规划地址后,能够PING通也能正常登陆。
5  当第二次系统下电再上电后又出现了前面的故障,这三个问题刀片在MM的WEB界面又变为DHCP状态,这种状态很可能是由于BMC的某些文件损坏造成。
6  使用winscp登录问题刀片的BMC地址,察看/data/backupip,发现配置文件的ip字段不正确,本来字段IP=192.168.100.59,但实际配置文件为P=192.168.100.59,这样就导致每次系统重起时,系统在从/data/backupip读取IP地址时由于配置文件的错误导致读取不到IP,这样BMC就变成了DHCP状态,原因找到了,下一步进行修改。
7   使用ftp或者winscp方式登录刀片BMC,删除/data/backupip文件,通过DHCP的地址直接登录BMC,修改DHCP地址为静态规划地址,以刀片静态telnet方式登录BMC,执行reboot复位BMC。这样就修改完成,再次下电后也不会出现问题了。
8   发生该问题是由于版本问题,最终解决办法后续版本解决,如果在此之前再次出现该问题,可以用此方法暂时规避。
根因
1  网络原因。
2  硬件故障。
3  系统文件损坏。

建议与总结
在修改/data/backupip文件时,一定先要删除该文件,否则在WEB界面修改为静态IP地址后是不能在/data/backupip文件生效的。

END