Galax下发配置时物理节点自动发现异常

发布时间:  2012-12-19 浏览次数:  83 下载次数:  0
问题描述
当被加载节点上电10分钟后,在“SingleCLOUD安装配置系统”中的加载状态仍处于“未加载”状态,即表示该节点可能发生了自动发现异常。如下图所示:

告警信息
处理过程
1.进入异常节点的bios中查看,系统的第一启动方式是否为网络启动,如果不是,修改为网络启动,保存后退出,重启异常节点服务器。如果启动方式正确,执行步骤2.

2.将异常节点下电后,登录MCNA节点,ping异常节点预先规划的固定IP,如果ping通则说明IP冲突导致加载异常,如果ping不通执行步骤3。

3.判断MNPortal页面上,节点信息填写是否正确:

进入机房,查看被加载节点eth0网口所连接的交换机及端口,与MNPortal上填写的是否一致。不一致,在MNPortal上修改异常节点配置信息或重新连接eth0所连接的交换机端口。

4. 判断交换机配置是否正确:

使用“PuTTY”,用ssh方式登陆到MCNA节点,执行ping <被加载节点的接入交换机名称>。如果无法ping通,请检查网络及配置。

使用telnet方式登录异常节点所连接的交换机。使用display current-configuration命令或者display snmp-agent community命令查看交换机的SNMP是否配置正确:比如查看团体名<Community name>与MNPortal上交换机一项中填写的团体名是否一致,如果不正确,请根据资料提供的交换机配置方法进行配置。


5. 判断异常节点所连接的交换机端口是否在管理平面网络的Vlan中:

进入交换机中,查看该节点eth0所连接的端口是否在管理平面网络划分的Vlan中。如果不在,修改端口的Vlan。

6. 排除同一网络平面中是否存在多个DHCP服务器:

登陆MCNA节点,执行命令sh /opt/galax/gcs/watchdog/script/shell/stopwatchdog.sh停止软件狗,然后执行命令service dhcpd stop停止DHCP服务,然后重启异常节点,观察异常节点是否分配到IP地址,如果分配到IP,则说明存在其他DHCP服务器,停止相应的DHCP服务器后,再执行命令sh /opt/galax/gcs/watchdog/ watchdog.sh –start启动软件狗,执行命令service dhcpd start,然后重启故障节点。

7. 检查DHCP服务:

使用“PuTTY”,登陆MCNA节点,执行命令service dhcpd status查看dhcp服务是否是running状态。如果不是执行命令service dhcpd restart启动DHCP服务。

8.   登录“SingleCLOUD安装配置系统”,查看节点加载状态:


根因
1.节点的启动方式配置错误。

2.MNPortal上节点连接的交换机和端口配置错误。

3.被加载节点连接的交换机和网络设置错误。

4.DHCP服务问题。

5.IP冲突。

建议与总结
1、如果节点是否仍处于“未加载”状态,请查看其它案例,或则联系华为热线。
2、加载过程中不要重启服务器

END