N8500挂载异构存储(Hitachi)部分路径故障

发布时间:  2015-08-06 浏览次数:  140 下载次数:  0
问题描述

客户现场1套华为N8500NAS引擎。下面挂载Hitachi一套存储,采用FC交换机双交换模式进行A/B控各2根光纤线的方式连接,由于异构厂商存储兼容性问题N8500提示部分链路故障的告警,通过路径查看,并无失效路径,采取对告警进行屏蔽方式处理。

告警信息


处理过程

步骤1分析日志,以及事件列表,对应时间点是否进行了部分路径切换等操作;

步骤2物理上排查光模块,光纤线是否有故障,进行替换测试:

步骤3master用户登录NAS节点,执行storage sanbus命令,对路径进行重新识别;

步骤4support用户登录各节点,执行vxdmpadm getsubpaths查看
以下内容供参考
XXXnas_01:~ # vxdmpadm getsubpaths
NAME         STATE[A]   PATH-TYPE[M] DMPNODENAME  ENCLR-NAME   CTLR   ATTRS
================================================================================
sdaf         ENABLED(A)   -          hitachi_usp-vm0_010c hitachi_usp-vm0 c9       -
sdau         ENABLED(A)   -          hitachi_usp-vm0_010c hitachi_usp-vm0 c9       -
sdb          ENABLED(A)   -          hitachi_usp-vm0_010c hitachi_usp-vm0 c8       -
sdq          ENABLED(A)   -          hitachi_usp-vm0_010c hitachi_usp-vm0 c8       -
sdag         ENABLED(A)   -          hitachi_usp-vm0_010d hitachi_usp-vm0 c9       -
sdav         ENABLED(A)   -          hitachi_usp-vm0_010d hitachi_usp-vm0 c9       -
sdc          ENABLED(A)   -          hitachi_usp-vm0_010d hitachi_usp-vm0 c8       -
sdr          ENABLED(A)   -          hitachi_usp-vm0_010d hitachi_usp-vm0 c8       -
sdah         ENABLED(A)   -          hitachi_usp-vm0_010e hitachi_usp-vm0 c9       -
sdaw         ENABLED(A)   -          hitachi_usp-vm0_010e hitachi_usp-vm0 c9       -
sdd          ENABLED(A)   -          hitachi_usp-vm0_010e hitachi_usp-vm0 c8       -
XXXnas_02:~ # vxdmpadm getsubpaths
NAME         STATE[A]   PATH-TYPE[M] DMPNODENAME  ENCLR-NAME   CTLR   ATTRS
================================================================================
sdaf         ENABLED(A)   -          hitachi_usp-vm0_010c hitachi_usp-vm0 c9       -
sdau         ENABLED(A)   -          hitachi_usp-vm0_010c hitachi_usp-vm0 c9       -
sdq          ENABLED(A)   -          hitachi_usp-vm0_010c hitachi_usp-vm0 c8       -
sdag         ENABLED(A)   -          hitachi_usp-vm0_010d hitachi_usp-vm0 c9       -
sdav         ENABLED(A)   -          hitachi_usp-vm0_010d hitachi_usp-vm0 c9       -
sdc          ENABLED(A)   -          hitachi_usp-vm0_010d hitachi_usp-vm0 c8       -
sdr          ENABLED(A)   -          hitachi_usp-vm0_010d hitachi_usp-vm0 c8       -
sdah         ENABLED(A)   -          hitachi_usp-vm0_010e hitachi_usp-vm0 c9       -
sdaw         ENABLED(A)   -          hitachi_usp-vm0_010e hitachi_usp-vm0 c9       -
sdd          ENABLED(A)   -          hitachi_usp-vm0_010e hitachi_usp-vm0 c8       -

步骤5发现设备均正常,无DISABLED路径,确认故障告警为误报,对告警进行手动屏蔽。(务必确认为误报信息)对ISM告警的ID0x3021F0023,换算成十进制12920487971

1.  ISM界面清楚告警,确认告警不出现再进行下一步操作;

2.  Support用户登录两个节点命令行,执行/opt/HS/bin/cnm_cli alarm mask add 12920487971命令;

3.  观察ISM告警不再出现,表示正常;

此种情形已经要确认告警为误报,或者非影响设备运行的告警进行执行,此命令行适用于绝大多数告警,故需要慎重操作。



根因

解决方案

1.  分别从存储,交换机,NAS引擎上进行排查包括(HBA、光纤线);

2.  采用scanbus,进行设备重发现;

3.  NAS底层操作系统,识别存储过来的路径是否丢失;

4.  异构产品设备是否误告警;

建议与总结

1、 研发针对设备兼容性进行补丁发布。

2、 升级产品软件版本,彻底解决此类问题。

3、 从最易方入手,逐步分析设备告警具体位置。

END