VCN500 语音对讲业务出现无法启动问题

发布时间:  2016-10-06 浏览次数:  208 下载次数:  0
问题描述

I国X运营线站点监控项目,在运营商的基站站点部署视频监控摄像头以及VCN500服务器,摄像头本地接入到VCN500,客户在运维中心登录客户端,向基站的摄像头请求实况以及录像回放;本项目也在站点安装了扩音器并连接至摄像头,实现单向语音广播功能。在系统部署完毕后,实况以及录像回放功能均正常使用,但语音广播功能一直无法使用,每次启动均直接在客户端侧报错,错误码为-2。


处理过程

由于项目使用客户现网上跑业务,而客户网络较为复杂,为了避免其他外部因素对系统影响,我们马上安排工程师到基站现场测试对讲功能。到了现场之后,通过基站局域网登录到系统之后,对讲功能正常使用,证明系统功能正常,问题很有可能存在于客户网络。

为了验证这个想法,我们分别在站点侧(点A)以及客户运维网络侧(点C),针对对讲功能进行抓包分析。抓包后对比发现,在运维中心的数据包比站点现场数据包缺少了一个200 OK的报文。

站点侧抓包,所有报文都正常通信,功能正常。

运维中心抓包,在ANNOUUCE 包之前的Reply 200 OK没有收到,造成业务无法建立而中断。

针对上述的分析,猜测问题出在站点侧网络与运维侧网络中间的防火墙上,防火墙把200 OK的报文拦截了。

带着这样的问题去找客户的防火墙管理团队,在防火墙的出入口也同样进行了抓包操作,发现抓出来的数据包跟预想一样,outbound的数据包比inbound的缺少了200 OK的报文,因此断定是防火墙拦截了。针对这个问题,马上提供VCN系统的通讯矩阵给客户,要求把所有涉及的端口,协议都放开限制后测试,但是语音对讲功能仍然无法正常使用,仍然缺少了200 OK的报文。

后来与客户沟通讨论,发现客户除了防火墙之外,还有IPS(入侵预防系统(Intrusion-prevention system))设备,能够监视网络或网络设备的网络资料传输行为的计算机网络安全设备,能够即时的中断、调整或隔离一些不正常或是具有伤害性的网络资料传输行为。鉴于此,请求客户检查IPS设备上的监控记录,发现IPS果然针对语音对讲的报文进行了拦截。

根因

问题根因是,语音对讲的200 OK报文,报文内容里面包含了一些具有潜在风险的端口以及服务器地址,IPS会对报文进行拆解并检查,发现有风险便联动防火墙进行拦截,导致业务无法正常启动。

而实况以及录像回放的视频请求业务中的200 OK报文,内容并未包含这些端口,因此业务可以正常启动。

解决方案

发邮件请求客户调整IPS上的策略,并提供语音对讲的数据包作为证据。客户很快就协调运维人员进行调整。语音对讲业务便能正常使用,问题解决。

建议与总结

1. 遇到问题先要简化问题场景,先规避其他外部因素的情况下,证明系统自身是否存在问题,先解决系统内部问题

2. 当遇到外部问题,比如网络,我们需要分段处理,也是从简单到复杂,从近到远的思路进行解决

3. 网络问题更需要把网络了解清楚细致,尤其是客户提供网络的项目,需要与客户进行详细沟通,才能更好的定位问题。

END