由客户聊天软件导致的网络时延和丢包问题处理

发布时间:  2016-12-26 浏览次数:  142 下载次数:  0
问题描述

 

客户网络结构如下


故障现象:

客户反馈每天早上8点至8点半,部分分支站点到总部的网络就出现故障,出现丢包和业务不通的情况,严重影响客户,中间运营商链路运营商已多次排查,确认非运营商链路问题。

处理过程

故障处理:
到达客户现场后,了解到客户网络出错故障时间都是在早上8点至8点半,这段时间正是客户开始上班的时间。处理步骤如下:


1,为了确认是否是运营商链路问题,在8点到8点半之间将客户网络所有接入交换口shutdown,不停的ping 运营商专线网间网地址,查看是否丢包,

如果不丢包,那就是局域网的问题

测试结果是不丢包,基本上定位为局域网有问题,接下来就是排查局域网的问题了

2,将全部交换口no shutdown。随后网络开始丢包,。逐台排查客户PC,排查时候发现有一台电脑一开机,系统一起来,就丢包。重启之后也一样,初步怀疑是这个电脑有病毒了。有可能是电脑病毒导致局域网泛洪进而导致网络丢包。


3,为确认步骤2的判断,又开了二楼的几个电脑,发现这几个电脑一开机,网间网也丢包。

4,怀疑步奏3的判断,根据客户的网络安全,不可能能几个电脑同时中毒。需进一步排查。

5,排查过程中发现部分的电脑都不是业务终端类型的电脑,为普通的PC,而在这些PC上,都很多开机启动项,其中一个开机启动项是飞秋。


6,现场怀疑是开机自动启动飞秋,根据飞秋的工作原理,飞秋一旦启动后,就将根据用户的设置,根据用户设置的IP地址,自动拉去所有好友,如果客户设备的好友非常多,或者说用户设置的好友IP是IP地址段的话,就占用大量资源。


7,验证步骤6的猜测,测试在网的任意一台PC,只要一开机,就自动启动飞秋,飞秋一启动,可明显看到网间网ping延时以及丢包,验证步骤6的猜测正确。

根因
飞秋启动过程中占用大量网络资源,导致网络时延及丢包
解决方案

1,在路由器上禁用飞秋的端口


2,全部停用飞秋,改用IM


3,做QOS,

4,做端口连接数限制。

END