存储S2600(V100R005)控制器在线更换

发布时间:  2015-01-10 浏览次数:  256 下载次数:  16
问题描述
S2600存储控制器A故障,当前版本信息为V100R005C02SPC008(1.04.05.128.T01);
设备采用双链路组网,归属控制器为A的LUN在A控故障后切换到B控工作,客户业务在单控模式下运行正常;

告警信息
A控制器告警灯亮红灯,控制框告警
处理过程
12月4日,到现场更换故障控制器:检查组网条件,为双链路;检查存储设备健康状态,除控制器告警外没有其他问题;检查主机状态,主机状态符合更换控制器的条件;
更换控制器后,控制器开始上电,串口打印启动信息,30分钟后,控制器告警,上电启动失败。怀疑是带来的备件控制器有问题,故重新申请一个控制器再来更换

12月8日,再次到达客户现场,用重新申请的控制器再次更换,更换后依然无法上电启动,打印信息与之前的一样。初步判定为备件Flash卡故障;故再次重新申请控制器来更换

12月11日,再次到达客户现场,使用新控制器更换后,依旧与之前故障一样。研发需要断业务分析情况,因为此时联系不上客户,故只能暂缓处理

12月12日,经研发工程师远程分析设备系统日志,排除硬件故障导致控制器无法上电的可能,分析得出:局点之前修改过存储FTP传输密码,导致控制器之间的FTP传输无法正常建立,因此控制器无法同步版本,导致新插入的控制器不能正常上电。更改FTP密码为默认后,新控制器完成了版本同步,启动成功

至此,故障恢复
根因
局点之前修改过存储FTP传输密码,导致控制器之间的FTP传输无法正常建立,因此控制器无法同步版本,导致新插入的控制器不能正常上电
解决方案
尝试在A控手工执行upgrade_ver_sync.sh脚本,分析故障位置,
发现在使用ftp进行文件传输时报错:get: Login failed: 530 Login incorrect.
进一步使用FTP命令单独模拟文件传输,发现由于B控的FTP密码被修改过,导致文件传输失败。
临时还原FTP密码为123456之后,FTP文件传输正常;再次拔插A控的控制板,系统很快恢复正常。
建议与总结
建议局点不修改存储内部FTP传输密码,这样,在存储设备有单控故障的时候,能够顺利更换新的控制器

END