GK服务器交替变蓝色和变红色无法正常上线

发布时间:  2013-03-16 浏览次数:  236 下载次数:  0
问题描述
国内某客户反馈,通过SMC管理几十个GK,其它所有的GK服务器都能正常上线,唯独新建的局点,无法正常上线,而且GK服务器状态比较奇怪,一会儿变成蓝色即将上线,但一会儿又变为红色,无法上线。如下图1所示:

                                                                                图 1

Resource Manager版本信息: release 6.10.05 2008.11.19
Switch Manager版本信息:  release 08.8.20
告警信息
无告警信息,查看GKM日志发现
09:27:39  [GKMSvr.cpp ][5285 ]  RpcRegTableGetNext() error(reason:0x0303000D)!
09:28:17  [CIM_SingleGKManageInfo.cpp  ][236  ]  Rev GK data failed(reason:0x00002746), disconnect GK(index:202 name:平潭综合实验区)!
09:28:49  [CIM_SingleGKManageInfo.cpp  ][236  ]  Rev GK data failed(reason:0x00002746), disconnect GK(index:202 name:平潭综合实验区)!
09:29:30  [GKMSvr.cpp][5285 ]  RpcRegTableGetNext() error(reason:0x0303000D)!
处理过程
1.首先核实了版本信息,所有局点都是采用的统一的GK和RM版本,虽然是新建的局点,但还是使用了以前那种分开版的Switch Center,其它局点都正常,就这个新建局点有问题,无法上线,可以排除版本问题;
2.网络问题,让客户长时间ping省级的GKM和RM地址均未发现有丢包,可以排除网络故障。
3.指导客户用netstat –a查看了端口信息,端口正常,1719和1720没有被其它服务占用,可以排除端口冲突问题。
问题陷入僵局,后来,把问题提升到研发,通过跟客户沟通发现,客户配置了主备GK,要求客户把vrrpd.ini以及gkconfig.ini文件取回进行分析如下:
[VRRPD]
#接口名称
interface=00:09:6b:84:63:f4
#VRRP_ID
virtual_router_id=50
#发送VRRP Advertise报文的间隔,以秒为单位
advert_int=1
interface=00:09:6b:84:63:f4这个参数是要正确填写GK服务器的MAC地址,跟客户核实而主GK地址的MAC地址为 00:21:97:02:8f:09并非00:09:6b:84:63:f4,同样备GK的MAC地址为 00:1e:90:bc:cb:32。
把vrrpd.ini中的interface参数改为实际的GK服务器MAC地址后问题恢复,主备GK均可以正常注册。
后来向客户了解情况得知,vrrpd.ini还有gkconfig.ini文件等配置文件都是客户从其它局点copy过来的,只把ip地址等参数修改了,忽略了interface这个参数,interface值还是填写的其它局点的MAC地址。
根因
1.版本不匹配,先安装的这个局点的Switch Center版本和其它局点的SM和RM不配套导致;
2.网络问题,检查下此局点GK服务器和省级的RM和SM是否存在网络问题,导致GK无法起来;
3.端口冲突,用netstat –a 查看下是否1719和1720端口被其它服务占用了;
建议与总结
以后遇到此类奇怪问题,要注意了解下客户的配置文件是如何获取的,从其它局点copy的配置,做过哪些修改,是否修改正确。
建议以后告知客户在没有对配置文件完全了解的情况下,尽量在新的局点重新配置参数,避免出现有某些参数忘记修改而导致未可知的奇怪现象。

END