更换控制器(适用于OceanStor 5310 V5/5310F V5)
介绍如何更换控制器。
对系统的影响
更换控制器期间,系统将该控制器端口所承接的业务切换至其它冗余端口:
- 对于前端链路和Scale-out链路,如果剩余链路无法完全承接当前业务性能,则业务I/O响应时延增大,系统性能降低;如果切换后无其它冗余链路,此时业务单路径运行,系统可靠性降低。
- 对于后端链路,此时该环路的硬盘均单路径运行,系统可靠性降低。
建议在业务不繁忙时更换控制器。
前提条件
更换前,请务必确认待更换的备件物理外观完好、未被挤压变形。若物理外观出现损坏或变形,请联系技术工程师确认是否仍可使用该备件进行更换。
- 待更换控制器所在机框的电源模块均状态正常(电源运行/告警指示灯为绿色常亮状态),若电源模块状态异常,请先更换电源模块。
- 如果待更换控制器上有业务运行,更换前请确认单个控制器的CPU的平均利用率不超过40%。
- 待更换的备件已经准备齐全。
- 已经定位待更换控制器的位置。
定位部件位置时,可以通过下列两种方法:
- 根据DeviceManager告警定位:在DeviceManager的“告警和事件”页面,根据告警帮助查看并定位待更换部件的编号、并根据此编号在设备现场确定待更换部件的实际位置。
- 根据部件的告警指示灯定位:指示灯详细说明参见对应产品型号《产品描述》的“指示灯介绍”。
- 待更换控制器上的线缆连接位置已经标识清楚。
- 如果用户手动更换过ibc_os_hs公私钥对,则必须对所有其它正常工作的控制器初始化公私钥对后才能进行控制器更换。
ibc_os_hs公私钥对是否为默认请关注FRU工具的检查提示,初始化方法为:使用用户名“_super_admin”登录控制框的串口,执行命令initibckey。
- 对于V500R007C60SPC300的之前版本,如果当前版本的存储系统支持SSH端口号配置,系统中每个控制器的SSH端口号必须为默认值22。对于V500R007C60SPC300及之后版本,则无需修改。
查看SSH端口号是否为22,请执行命令show system server_port server_name=SSH 。如果不是,请修改SSH端口号为22,执行命令change system server_port server_name=SSH port_num=22。
注意事项
推荐工具和材料
- 防静电腕带
- 防静电包装袋
- 标签纸
操作步骤
- 更换前检查。
- 系统状态检查。
打开SmartKit,在主界面上选择“首页 > 存储 > 例行维护 > 健康检查”。进入“健康检查”页后,根据向导提示执行巡检。详细信息参见检查系统状态。
等待巡检结束后,如果存在检查项不通过的情况,请根据巡检报告上的修复建议进行故障修复。确保除需要更换的部件外,其它系统状态正常。
- 待更换部件更换评估。
打开SmartKit,在主界面上选择“首页 > 存储 > 部件更换 > 备件更换评估”,如果存在检查项不通过的情况,请根据界面上的提示进行修复。
- 待更换部件更换前检查。
打开SmartKit,在主界面上选择“首页 > 存储 > 部件更换 > 备件更换”,进入“备件更换”页后,按步骤执行“FRU更换”,根据提示完成更换前检查。详细操作指导参见FRU更换实例。
只有更换前检查通过,系统进入更换界面后,才能执行下一步。如果存在检查项不通过的情况,请根据界面上的提示进行修复。
- 系统状态检查。
- (可选)若需要清除待更换故障控制器的数据,请参见如何清除待更换控制器数据进行处理。
- 佩戴防静电腕带。
- 拆卸待更换控制器中的接口模块。
- 拔出连接在接口模块上的线缆。
- 压住接口模块上的卡扣,按照箭头方向拔出接口模块。如图8-51所示。
- 将取出的接口模块放入防静电包装袋。
- 拔出连接在控制器上的线缆。
- 拨开控制器两侧扳手上的卡扣,同时捏住两侧扳手拉出控制器,如图8-52所示。
- 将取出的控制器放入防静电包装袋。
- 将已准备好待安装的控制器从防静电包装袋中取出。
- 拉开待安装控制器的扳手,将控制器插入空槽并尽可能向里推,如图8-53。
- 按住扳手,继续将控制器向里推,直至控制器完全插入槽位,如图8-54所示。
- 将拆卸的接口模块按原位置插入空槽,直至接口模块完全插到位。如图8-55所示。
- 按原位置依次连接线缆。
- 等待5分钟左右,根据控制器电源指示灯的状态,判断控制器是否正常上电。指示灯的位置如图8-56所示。
- 绿色,亮:控制器正常上电。
- 绿色,闪烁,且控制器告警指示灯黄色,闪烁:控制器正在定位。
- 绿色,闪烁(0.5Hz):控制器刚上电,处于BIOS引导阶段。
- 绿色,闪烁(2Hz):控制器处于操作系统引导阶段或者处于下电流程处理阶段。
- 灭:控制器不在位或未上电。
1
控制器电源指示灯
2
控制器告警指示灯
- 更换后确认。
- 待更换部件更换后检查。
- 若更换前FRU工具能够识别出故障控制器:
完成硬件更换操作后,回到SmartKit界面,单击“确认已更换”。并根据界面提示完成更换后检查。
- 若更换前FRU工具无法识别出故障控制器:根据控制器告警指示灯的状态,判断控制器是否正常工作。指示灯的位置如图8-56所示。
- 黄色,亮:控制器出现告警。
- 黄色,闪烁,且控制器电源指示灯绿色,闪烁:控制器正在定位。
- 灭:控制器工作正常。
当新安装的控制器版本与原故障控制器版本不一致时,更换后,控制器会进行版本同步,耗时约30分钟,最长60分钟。若超过60分钟,请联系华为技术工程师。同步过程中,请勿拔出控制器或下电存储系统。
- 若更换前FRU工具能够识别出故障控制器:
- 更换后系统状态检查。
单击“备件更换”页面的“巡检”, 再次进行系统状态检查。如果存在巡检不通过的选项,请根据巡检报告上的修复建议进行故障修复。
- 执行以上操作后,您还需要在主机侧检查主机业务情况,关注是否存在与存储相关的报错。
- 待更换部件更换后检查。
后续处理
控制器更换操作完成以后,请使用标签纸将更换下的控制器做好标识,以便进行后续处理。