N8500配置仲裁盘后NAS集群无法启动

发布时间:  2015-11-19 浏览次数:  351 下载次数:  2
问题描述

某局点N8500,单节点双控,初始化正常,扫描数据磁盘正常,配置仲裁盘后NAS集群无法启动。

执行fencing on disk001,disk002,disk003命令,配置N8500I/O Fencing仲裁盘,配置完成自动重启后,集群无法启动,console IP无法ping通。

处理过程

1.  因测试局点新开局,无业务数据,使用初始化命令清除设备,重新按指导书流程开局。

通过串口登录到每一个节点(使用support用户)上面,执行以下两个脚本:

/opt/HS/scripts/clean_hs.sh

/opt/VRTSnasgw/scripts/cleanup.sh

然后重启集群所有节点,最后重新执行开局工具进行部署。

2.  开局初始化配置成功,扫描存储LUN成功。

3.  通过主节点的管理网口物理IP登录,重新配置仲裁盘,集群重启后仍然无法启动。

4.  分析故障原因,因仲裁盘是集群防止脑裂所用,故在主节点与从节点之间的区别开始检查。

5.  发现NAS从节点与存储设备链路不通,无法发现存储的LUN

6.  恢复NAS从节点与存储设备链路,重新开局,配置仲裁盘成功。

根因

NAS从节点与存储设备链路不通,造成无法发现仲裁LUN,故执行创建仲裁LUN命令后,NAS主节点与从节点配置不同,集群分裂,无法启动。 NAS开局工具是带内初始化,故可顺利开局,但配置仲裁盘后无法启动。

仲裁盘:用于集群成员关系变化时,确定成员角色的逻辑盘

VCS集群中配置Fencing功能后,集群节点会在仲裁盘上注册key,当集群脑裂后,节点通过抢占仲裁盘来实现集群的仲裁。

配置Fencing功能后,系统启动LLTGAB后,将读取Fencing盘上的KEY值,并通过GAB分析的成员关系,然后比较发现有的节点Fencing KEY值存在但是GAB中没有该节点存在,VCS认为这种异常是存在潜在的集群脑裂。

NSA从节点无法与仲裁LUN连通时,进行配置,造成集群配置不一致,形成冲突,无法启动。

解决方案

恢复NAS从节点与存储设备链路,重新开局,配置仲裁盘成功。

建议与总结

严格按照产品指导书流程操作。

END