FusionComputer同一网段两台虚拟机能够PING通,不能SSH到对方的故障处理案例

发布时间:  2014-08-13 浏览次数:  620 下载次数:  16
问题描述
FusionCompute创建两个分布在不同CAN上的管理平面虚拟机,互相能够PING通,也能SSH到对方,切换虚拟机端口组到业务平面端口组(两个虚拟机使用同一端口组),互相能够PING通,不能SSH到对方。
服务器:E9K
网卡:MZ510扣卡  BE3 10GE网卡
版本:FusionSphereR3C00SPC300

告警信息
FusionCompute同一网段两台虚拟机能够PING通,在业务网络不能SSH到对方,但在管理网络能够互相ssh对方
处理过程
1. 1. 查看虚拟机上SSH服务是否启动:ps –ef | grep ssh

结果:正常
2. 2. 查看虚拟机ssh端口是否正常: netstat –alt

3. 将虚拟机上iptables规则全部清空:iptables –F
结果:虚拟机仍然不能SSH到对方
4. 将虚拟机的pv-driver卸载
结果:虚拟机能SSH到对方
5. 安装虚拟机pv-driver,将两台虚拟机迁移到同一主机上
结果:虚拟机然SSH到对方
步骤5与局点现象相比,差异点是数据包一个不出CAN,一个出CAN,因此怀疑可能网卡驱动存在问题
6. 查看网卡驱动版本: ethtool –i eth0
linux-JyRAav:/home/GalaX8800 # ethtool -i eth0
driver: be2net
version: 4.1.402.6
firmware-version: 4.4.262.3
bus-info: 0000:02:00.0
supports-statistics: yes
supports-test: yes
supports-eeprom-access: yes
supports-register-dump: no

发现be2net网卡驱动版本与固件版本不一致,此前在山西孝义局点出现过版本不一致导致创建虚拟机慢(经分析是存储面丢包)
根因
Be2net网卡驱动版本与固件版本不一致的情况下,会出现各种网络问题(比如丢包,收发带有vlan标签的数据包时有时剥离vlan标签,有时不剥离)。
建议与总结
升级主机domain0的网卡驱动版本,与微码版本保持一致。
具体升级办法:
1. 迁空待升级主机上的业务。
2. 获取FusionAdaptor与产品匹配的版本(安装包里一般带有相匹配的FusionAdaptor包)
例如:FusionAdaptor V1.1.00.500_Driver.zip
获取相匹配的安装指导书:FusionAdaptor V1.1.00.500 设备驱动安装指导书 01.zip
例如:请见附件。

END