华为FusionCompute 虚拟化平台存储接口与存储业务通信异常导致关联存储资源失败

发布时间:  2014-09-28 浏览次数:  302 下载次数:  2
问题描述
客户现场环境有一台S5700交换机,有一台E6000刀片服务器,带有两块NX112交换板,分别为A1和A2.另外还有一台存储S2600T。存储与服务器刀片通信是通过S5700交换机与刀片服务器的两块交换板对接。存储A控的P0端口和存储B控的P0端口各接一根网线到S5700交换机上的13端口和14端口。E6000服务器A1和A2交换板的ETH1各接一根网线出来接在S5700的1端口和15端口。
在S5700交换机上创建了两个VLAN,一个是管理业务平面的VLAN 10 ,所属端口是1-12.一个是存储平面的VLAN 20,所属端口是13-24. 刀片服务器A1平面的NX112交换板的配置是与各个刀片的ETH0对应的1-10的端口类型配置为access允许默认VLAN 10 通过,在交换板出接口的ETH1上配置端口类型为trunk ,允许所有VLAN 通过。同样的在刀片服务器A2平面的NX112交换板的配置同A1平面的类似,只是把允许通过的VLAN 10更改为VLAN 20。然后再登录FC 平台,选择“虚拟数据中心管理>存储管理”进入“存储管理”页面选择“配置>存储资源”,单击添加存储资源。完成存储资源添加之后,为主机添加数据存储。在FusionCompute选择“虚拟数据中心管理 > 主机和集群”,进入“主机和集群”页面,选择“站点>集群>主机”进入主机入门页面,选择“配置>系统接口>添加存储接口”,添加与存储业务在同一网段的地址。存储接口添加完成之后,关联存储资源失败。
告警信息
关联存储资源失败,任务返回失败。
处理过程
根据问题现象,首先查找产品文档,并咨询400在FC上用来创建存储接口的端口是否有误,400回复端口是正确的,确认无误之后自己做了如下几个操作:
1、确认所使用的网线是否有故障,查看网线所连接的端口,端口的指示灯都是正常的,说明网线在物理上没故障。
2、检查交换机的端口配置是否有误,使用串口线登录交换机查看所连接的端口显示都是UP状态。在交换机上ping存储的业务地址,可以ping通。说明交换机到存储的链路是没问题,这个可以排除掉。
3、把交换机到存储的链路故障排除之后,接下来就查看交换机到刀片服务器的交换板的链路是否有故障,经检查配置信息都是正确的。
4、再次查看FusionCompute的产品文档,发现刀片的ETH1网口与交换板对应的1-10端口模式应该配置为trunk,而不是access。通过串口线登录A2交换板,把1-10的端口模式改为trunk,允许所有VLAN通过。然后再到交换机上去ping FC存储接口的地址,结果显示ping通了。继续关联存储资源,显示存储资源关联成功。
根因
E6000刀片的网口ETH0与交换板直连的端口配置有问题。
解决方案
通过串口线登录A2交换板,把1-10的端口模式改为trunk,允许所有VLAN通过。
建议与总结
1、 遇到问题一步一步排查,首先排除物理上链路的问题,再登录到设备上核实软件配置是否有误。
2、 排除问题的时候,都要保证只有一个变量。

END