eSight网管拓扑图图标不定时离线故障排查

发布时间:  2015-11-16 浏览次数:  231 下载次数:  2
问题描述

如下图所示:eSight网管运行稳定,但存在个别拓扑图图标不定时显示灰色离线状态,导致无法及时反馈设备告警


告警信息

登陆网管监控界面,发现离线设备存在SNMP认证失败告警,如图所示:


处理过程

1.  在此设备非离线状态下查看其SNMP信息,发现SNMP信息配置无错误,如下图:


2.  查看此设备的ARP,在全网内排查,未发现此设备与其它设备存在ARP冲突;

3.  查看此设备及其互联设备配置,发现此设备未配置STP协议,如下图:


 

4.梳理网络拓扑,得知此网络为二层网络;查看网管服务器的网关为10.12.0.1(如下图所示),网络中受控交换机管理地址为192.168.X.X/16,网关为192.168.0.1,两者网关不一致;在网管服务器内通过CMD新加一条到192.168.0.0/16网段且下一跳为192.168.0.1的网关路由,拓扑图相关设备不定时离线问题解决。



根因

由于二层网络内所有设备网关为192.168.0.1,而网管服务器网关为10.12.0.1,两者之间原先通过同一二层交换机达到数据交互作用。但受管控的交换机存在未配置到192.168.0.1的缺省路由,在网管服务器通过ICMP探测目的设备是否健康使用过程中,部分地址存在阶段性不可达

解决方案

网管服务器新加一条静态路由问题解决。

具体操作:运行→CMDRoute add 192.168.0.0 mask 255.255.0.0  192.168.0.1

建议与总结

在现场告警日志无法确定故障点的时候,需要通过缩小故障点排查故障所在。

END