FusionCompute关联存储设备失败

发布时间:  2017-05-27 浏览次数:  104 下载次数:  0
问题描述

客户新增IP-SAN存储,FusionCompute三台CNA节点通过专用的存储接口连接在华为S5700交换机上。

交换机和CNA互联的网口配置了端口绑定(基于源和目的MAC地址的负载均衡模式)在FusionComputeV100R006C00U1上关联存储设备失败。

交换机IP地址为10.10.10.21,CNA1节点IP地址为10.10.10.4、CNA2节点IP地址为10.10.10.5、CNA3节点IP地址为10.10.10.6,存储业务IP地址为10.10.10.10。

告警信息



处理过程

1、登录CNA1节点进行PING测试,ping交换机地址10.10.10.21和存储业务IP地址10.10.10.10,通信正常。


2、使用iscsiadm命令发现并登录存储成功,在CNA1上添加存储资源成功,并且可以添加数据存储。说明CNA1各项状态正常。

3、登录CNA2和CNA3,分配ping交换机和地址和存储业务IP地址,发现网络通断情况不一。怀疑网络限制或者网络规划有误。


4、查看交换机上流量策略,发现并没有流量限制相关配置。



5、查看CNA1节点存储接口配置和交换机与其互联的端口配置。发现CNA1上配置了端口绑定,但交换机上并未配置相关绑定,实际流量都是从单一端口进出。进一步怀疑端口绑定负载分担错误。





6、经过仔细检查配置,发现CNA2配置了端口绑定。但是交换机上配置的链路聚合为手工模式,而我们的FC平台要求交换机侧聚合模式为LACP。






7、通过修改交换机侧与CNA2、CNA3互联的绑定端口模式为静态LACP模式以后,业务添加正常。IP-SAN可以正常使用。








根因

FC平台业务接口配置绑定以后,对端交换机侧链路聚合策略一定要配置成LACP自动协商的模式。否则会由于交换机侧链路聚合模式为手动,FC侧为LACP导致LACP协商失败,网络无法正常通信。

解决方案

根据FusionCompute产品文档描述,在网口进行绑定的场景下:
在负荷分担模式下,需要在网口连接的交换机上做端口汇聚配置,即将主机待绑定的网口在对端交换机上的端口配置到同一个Eth-trunk,否则会导致网络通信异常。
在LACP模式下,需要在网口连接的交换机上创建LACP模式的Eth-trunk,并在该Eth-trunk上开启BPDU协议报文转发功能。
以华为 S5300交换机为例,可通过以下命令配置:
<S5352_01>sys
[S5352_01]interface Eth-Trunk x
[S5352_01-Eth-Trunkx]mode lacp-static
[S5352_01-Eth-Trunkx]bpdu enable

建议与总结

在个别节点通信正常,其它节点异常的情况下。通过对比各个设备间配置的不同来进行进一步的思考来排查出问题所在。

END