会场大规模丢包导致画面抖动及花屏问题分析

发布时间:  2016-02-03 浏览次数:  389 下载次数:  0
问题描述
客户A会场使用主(4M)备(2M)IP线路接入视讯终端,会议过程中,A会场有主备切换的需求,当主用网络切换至备用网络时,A会场画面正常,切换对会议基本无影响;备用网络切换主用网络时,A会场图像出现抖动及花屏现象,本会场与其他会场互看失败,结束并重建会议后,故障现象消失。
告警信息
当A会场由备用线路切至主用线路时,SMC提示丢包告警。
处理过程

会场图像异常的故障仅涉及A会场,首先我们采取了替换本会场终端的方法,在替换后故障依然存在,排除了因终端硬件故障引起的图像异常这个可能。
会场线路由2M切换4M过后,通过在MCU侧及终端侧抓包,我们发现,IP为10.144.177.212的MCU信令板到IP为10.144.109.250的A终端的H.245信令无法正常送达,一直在重传(TCP Retransmission)状态,在手动挂断会议之前,这种TCP链路异常导致了H.245信令始终无法交互,从而影响了A会场终端的I帧申请,导致会场观看图像异常等现象。


根因
MCU需要与终端通过基于TCP的H.245会议控制协议协商能力集以实现媒体控制,其中也承载了显著影响视频图像质量的I帧申请信息。而抓包显示客户在备用线路切至主用线路后,TCP链路异常,导致H.245信令无法正常送达,一直在重传状态。影响了A会场的I帧申请,导致会场观看图像异常。
解决方案

彻底解决措施:由于故障由2M线路倒换4M线路时TCP链路异常引起,对于客户A会场的承载网络及主备切换机制我们并不清楚,建议客户自行或联系相关厂商排查承载网络,重点排查在2M线路切换4M线路时,端口11754到1320的TCP链路。
规避解决措施: 在问题彻底解决前,建议客户使用4M或2M单路承载会议。或在2M线路倒换4M后,立即结束并重新预约会议。

建议与总结
对于视频会议中会场画面花屏、马赛克、卡顿、跳帧等问题,根据笔者的经验,绝大多数由承载网络问题引起,解决问题的关键在于提供足够有力的证据说服客户接受此观点,而抓包则是最好的排查问题及提供证据的手段,往往让问题迎刃而解。

END