FusionCompute某CNA主机上虚拟机不能启动

发布时间:  2015-05-09 浏览次数:  125 下载次数:  0
问题描述
虚拟机一直处于故障恢复中,虚拟机没有HA迁移到其他主机。
处理过程

1.使用ifconfig检查所有网卡和bond是否在线,发现所有网卡及bond都是UP状态:

ifconfig

eth1      Link encap:Ethernet  HWaddr F8:4A:BF:55:6B:28

          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

          RX packets:0 errors:0 dropped:0 overruns:0 frame:0

          TX packets:0 errors:0 dropped:0 overruns:0 carrier:0

2.Ping存储业务IP不通,所以确认问题是由于主机和存储连接异常,导致OS硬盘不能被卸载。

3.因iscsi bond是UP的,所以需要检查存储是否正常。
登入其他正常的CNA主机节点,ping存储业务IP都能正常ping通,同时使用iscsiadm -m session, 也可以看到会话是正常的。

4.登入FusionCompute portal检查bond状态,发现有一个port的端口速率为100MB

5.禁用PORT4后,网络网络恢复正常,虚拟机正常启动。


根因

因bond绑定模式bond2:load balancing (xor),该模式将限定流量,以保证到达特定对端的流量总是从同一个接口上发出。当网卡降速为100MB时,网口没有被置坏,而是继续工作,但因速率不匹配又与存储通信失败。禁用此网口后,bond会将特定对端的流量放置其他网口工作。

END