2003系统上安装SMC后添加GK不在线

发布时间:  2014-04-04 浏览次数:  304 下载次数:  0
问题描述
DELL服务器上新安装SMC1.0,安装完成后都能正常打开会议管理和节点管理,但是添加的GK就是不在线,RM SM SC SQL的服务都是正常启动的
告警信息
处理过程
1)不上线怀疑GK服务假启动(过一会就自动停),手动去重启SC服务,结果等待很久都没启动了,SC服务直接停止了!根据经验指导结束windows snmp 和windows time 服务后重启电脑还是不行。cmd模式下输入netstat –a –n –o  发现都没有161 162 1719 1720这几个端口号然后让客户采集操作系统的应用程序日志和系统日志回来分析,发现应用程序和系统日志里面也没有什么相应的错误信息!
2)GK和GKM的配置文件如下:
GKM的配置如下
[DATABASE]
#SM访问的数据库类型。0:Oracle;1:Access;2:SQL Server(缺省)。
TYPE=2
#SQL SERVER数据库驱动程序名,缺省值为SQL Server 。
DBDRIVER=SQL Server Native Client 10.0
#数据源名称 (DSN), 数据库对应的机器名或者IP地址。

DSIP=10.115.3.31\SQLEXPRESS
#数据库的网络服务名,SM通过网络服务名访问数据库,写入和读取数据。缺省值为gkmdb
#(请勿在数据库名称中使用'.'作为连接,如HUAWEI.SOFT,将导致未知错误)。
DBNAME=smcdb
#SM访问客户端的用户名(UID)和密码(PWD),安装SM数据库时设置。缺省值分别为yunying和yunying
#【注意】用户名和密码区分大小写。
UID=yunying

GK的配置文件如下:
[SM-SETTING]
#SM通道的对端(SM)地址,SC从该地址获取运行参数。
SM-IP=127.0.0.1

#SM通道的本地(SC)地址,SC用该地址和SM通信。
IP-Management=127.0.0.1

[SYSTEM-SETTING]
#本地SC的名称,在网管侧显示,缺省值为主机名。不超过255个字符。
SC-name=localhost
此时怀疑极大可能是127.0.0.1地址问题,然后把127.0.0.1改为实际IP地址后,然后重启电脑,打开节点管理后发现还是不行,重启GK服务还是会启动不了。

查看GKM的日志发现有报错,报错为:
15:11:27  [CIM_MultiGKManageInfoSet.cpp][421  ]  No defined GK in DB!
15:11:28  [CSM_RegOnRMCCThread.cpp     ][154  ]  GKM(127.0.0.1) connect MS failed(reason:0x0101000A)
15:13:49  [GKMSvr.cpp                  ][1322 ]  GKM UI connnected. Serial:7733
15:26:15  [GKM_Parameter.cpp           ][1217 ]  DB CATCH error: Named Pipes Provider: Could not open a connection to SQL Server [2].
A network-related or instance-specific error has occurred while establishing a connection to SQL Server. Server is not found or not accessible. Check if instance name is
15:26:24  [CSM_RegOnRMCCThread.cpp     ][154  ]  GKM(127.0.0.1) connect MS failed(reason:0x0101000A)
15:26:48  [GKMSvr.cpp                  ][1322 ]  GKM UI connnected. Serial:31591
15:26:52  [GKMSvr.cpp                  ][5413 ]  RpcRegTableGetNext() error(reason:0x0303000D)!
15:29:24  [GKMSvr.cpp                  ][1322 ]  GKM UI connnected. Serial:17755
15:29:27  [GKMSvr.cpp                  ][5413 ]  RpcRegTableGetNext() error(reason:0x0303000D)!
15:38:48  [GKM_Parameter.cpp           ][1217 ]  DB CATCH error: Named Pipes Provider: Could not open a connection to SQL Server [2].
A network-related or instance-specific error has occurred while establishing a connection to SQL Server. Server is not found or not accessible. Check if instance name is

15:38:57  [CSM_RegOnRMCCThread.cpp     ][154  ]  GKM(127.0.0.1) connect MS failed(reason:0x0101000A)
15:39:11  [GKMSvr.cpp                  ][1322 ]  GKM UI connnected. Serial:11488
15:44:03  [GKMSvr.cpp                  ][5413 ]  RpcRegTableGetNext() error(reason:0x0303000D)!
然后GK的目录下没有任何文件夹,查看代码集发现这两个代码的含义是数据库连接地址错误,检查配置文件发现:
3)因为之前有遇到2003系统的补丁没有打导致RM软件连接数据库出问题的情况,所以怀疑有可能和这个有关,然后询问客户2003的版本。得知版本后比较发现都是正常的。
上述的常规排查方法都用完了实在不知道还有什么可能了,咨询研发和其他同事后,想到2.0中的GK遇到的权限的问题还有可能进程卡死,于是先让用在任务管理器理解结束gksvr.exe然后再登录节点管理后就发现上线了
根因
1.服务/端口冲突
2.配置文件问题
3.操作系统问题
建议与总结
总结:在遇到GK类问题的时候一般都是常规排查方法,如果常用手段就用完了后不妨换个思路看看,有时候会发现解决问题的方法都是些小操作,实际上在做这个小操作之前做了很多操作和排查结果发现还是小操作问题!

END