FusionCompute R3C00向集群添加CNA报错,与主机通信异常

发布时间:  2015-04-01 浏览次数:  732 下载次数:  0
问题描述
在FusionCompute portal上向集群添加CNA09报错:

1. 任务中心提示与主机通信异常;
2. VRM和CNA09的管理IP,BMC IP可互相ping。

告警信息
任务中心提示向集群添加CNA09失败,与主机通信异常。
处理过程
1. 排查是否BMC用户名和密码错误——使用RH2488服务器默认ADMIN/ADMIN,可以登录BMC portal。

2. 排查是否添加了错误的IP——使用10.42.1.116和10.42.1.21,可以正常登录BMC或Putty登录。

3. 排查是否网关或路由异常。
——Putty VRM和CNA09,管理IP、BMC IP可以相互ping;
——Putty CNA09,cd etc/sysconfig/network,查看ifcfg-eth0和routes文件,显示IP为10.42.1.116,GW配置(10.41.1.1)可能不正确;
——使用root -n查询节点路由信息,参照CNA01节点,发现CNA09上少了一条Flag为UG的路由。
CNA01:/etc/sysconfig/network # route -n
Kernel IP routing table
Destination     Gateway         Genmask         Flags Metric Ref    Use Iface
0.0.0.0         10.42.1.1       0.0.0.0         UG    0      0        0 Mgnt-0

由此可以判断,CNA09路由信息配置有误,导致与VRM内部通信异常。



4. 哪里出错了呢?——可能是在给CNA安装UVP OS时会漏添了GW,虽然后来在 etc/sysconfig/network/routes 配置文件中手动加入,但是系统还存在其它配置文件未写入。

5. 解决办法:
a. 手动配置正确的网关,尝试重新添加BMC(本例未生效);
b. 按照GPI手册重新安装CNA09的UVP OS,确认网关信息配置无误,重新在VRM portal中添加主机成功。
根因
可能原因:
1. BMC用户名和密码错误;
2. 添加了错误的IP;
3. 网关或路由异常。

建议与总结
1. 安装配置过程需严格按照GPI手册,防止漏填信息导致安装后异常;
2. 在VRM添加主机节点错误后,提示信息需要更加准确,提供排查和处理异常的方法指导。

END