FusionCompute添加主机失败

发布时间:  2016-05-28 浏览次数:  325 下载次数:  0
问题描述
客户之前的操作是,将该节点从集群中移除过,重装系统后再次添加该节点报添加主机失败,报错信息是发送消息到主机失败
告警信息
错信息是发送消息到主机失败
处理过程

出现该问题的原因一般是VRM与主机通信异常,指导客户分别登录VRM主节点和该CNA节点尝试互ping,发现CNA节点可以pingVRM虚拟机,但是VRM虚拟机ping不通CNA节点,在vrm中执行arp命令没有学习到CAN主机的IPMAC对应关系,在CNA节点执行arp可以正常学习到VRM主节点IPMAC对应关系。怀疑可能是IP冲突导致尝试修改CNA节点IP地址问题依旧。尝试重启该CAN节点,在刚刚开机的10分钟左右VRMCAN节点可以正常通信,并且主机可以加入到集群,10分钟后在FC界面报主机与VRM心跳异常,主机状态变为故障。

登录交换机查看该节点配置,发现该主机与其他主机一样在对应的交换机接口上配置了eth-trunk,该问题导致主机与VRM通信异常,eth-trunk的工作原理是两个接口均有数据流量,并且数据报文随机走两个接口。一台主机对外发送报文并且收到对端响应的报文,才会形成一个完整的会话链路,现场环境主机有eth0eth1两个接口,对应的物理交换机配置了eth-trunk但是主机测未配置端口绑定,这样会出现主机从eth0接口发出的报文,对端响应报文概率性的发送到了该主机的eth1接口,导致主机对外通信异常。

根因

登录交换机查看该节点配置,发现该主机与其他主机一样在对应的交换机接口上配置了eth-trunk,该问题导致主机与VRM通信异常,eth-trunk的工作原理是两个接口均有数据流量,并且数据报文随机走两个接口。一台主机对外发送报文并且收到对端响应的报文,才会形成一个完整的会话链路,现场环境主机有eth0eth1两个接口,对应的物理交换机配置了eth-trunk但是主机测未配置端口绑定,这样会出现主机从eth0接口发出的报文,对端响应报文概率性的发送到了该主机的eth1接口,导致主机对外通信异常。

解决方案

拆分交换机的端口聚合,将两个聚合接口配置一致后在Fusioncompue界面做主备绑定,绑定后修改主备绑定模式为基于源和目的MAC的负载分担,然后在交换机上将两个接口的配置清除,配置eth-trunk链路聚合,在聚合接口上配置透传VLAN信息,问题解决。

建议与总结

如果添加主机失败,提示该主机已添加到其他站点,需要按照主机网络残留的思路排查主机的残留信息。

END