TTR2.1eOMC(PC版)显示不正常告警

发布时间:  2014-03-09 浏览次数:  304 下载次数:  0
问题描述
在设备正常运行,业务正常实现的情况下。通过自己电脑登陆PC版eOMC,发现有eAPP调度机服务器eMDC610异常退出告警,及eMDC610服务器license过期告警。告警显示的情况发生过,但是实际已经恢复正常,但是eOMC的专网设备操作维护客户端依旧显示这些告警。
告警信息
显示两类告警:
(1)重要告警4个:服务异常退出告警,eMDC610调度机服务器;
(2)严重告警1个:服务器license过期;eMDC610调度机服务器;



处理过程
1.首先,根据告警处理建议指导书查看对应的情况:查看license,license未过期(之前临时license过期过几天,之后已加载商用license);怀疑是否是eOMC(PC版,自己电脑)与eAPP设备链路不通,导致告警未同步。

2、因为之前已经完成远端维护通道的搭建,所以再次确认,通过自己电脑(安装有PC版eOMC)ping调度机服务器维护IP地址,能够ping通;


3、初步判断两个告警原因:可能是因为调度机服务器的告警未同步到PC版eOMC上,所以在eOMC的专网设备操作维护客户端,在eAPP设备上点击右键,按“告警同步”,观察现象,告警未消除;


4、输入调度机eMDC610的维护网址,直接远程登录WEB页面的eAPP,发现的确存在这两类告警。按照指导书上告警处理建议,可能是一个名为“ubp_mrs_rec_man”的服务有问题。所以查看eAPP“服务”,打开WEB页面的eAPP,点击“系统监控”-》“服务”,查看所有服务,发现的确有一个服务名称为“ubp_mrs_rec_man”的服务显示“Failed”,联系研发确定这个服务进程影响到eOMC上告警显示;


5、之后按“重启服务”,几分钟后,服务名称为“ubp_mrs_rec_man”的服务依旧显示“Failed”;


6、重新分析这个服务,根据研发建议,ubp_mrs_rec_man与录音录像的节点配置有关,打开“录音录像配置管理”,发现之前配置的有两个节点。删除其中一个(第2个),之后再打开点击“系统监控”-》“服务”,查看所有服务,服务名称为“ubp_mrs_rec_man”的服务显示“Running”;


7、打开eOMC,同步告警,发现有一个“重要告警”消除。打开WEB页面的EAPP,查看“告警管理”下拉菜单下的“告警监控”;


8、从上面看到:只有一类中的一个告警消除,查看“告警管理”下拉菜单下的“告警查询“(历史告警),为自动消除的告警。而同类型的告警没有消除,判断为”假“告警,手动消除该类(服务器异常退出)告警,观察2天看告警是否产生,没有产生;对于”license过期告警“,实际已在过期的后几天成功加载商用license,所以手动消除该类(icense过期告警)告警,观察2天看告警是否产生,没有产生;







根因
1、判断分析是否的确存在这两类告警,如license过期,查看license情况;
2、eOMC和eAPP链路不通,导致告警不能及时同步到PC 版eOMC,查看链路情况;
3、eOMC未同步eAPP告警,尝试手动同步告警;
4、若eAPP有告警,则按告警处理建议书处理;
5、如果实际不存在告警,如license已加载,目前license未过期,需要查看与告警相关的服务是否启动;
6、如果与告警相关的服务已启动,告警依旧存在,则为假告警,可以手动消除;
7、如果手动消除后,告警过段时间又产生,则为BUG,需要联系研发解决。
建议与总结
1、在远端eOMC上观察告警,首先保证eOMC和各网元是互通的,之后再手动同步告警;
2、另外,还可以直接登录WEB页面查看各网元的告警,如eAPP\eNodeB\eSCN等;
3、如果按照告警处理建议操作,实际从其它情况可以判断告警提示的情况已恢复,但仍然未消除的告警,可以尝试手动消除,观察手动消除后该告警是否会复发;
4、手动消除”假“告警仍出现的,需要联系研发解决;

END