NE20E-X6路由器由于QOS配置问题导致OA业务丢包问题分析

发布时间:  2014-12-12 浏览次数:  274 下载次数:  0
问题描述
涉及设备:NE20E-X6 ,版本:V600R008C00SPC100。
拓扑:

问题描述:
某局点客户,NE20E作为核心路由器,通过2M或者4M专线链路连接到各分公司,下挂防火墙连接S9306交换机,交换机上连接OA服务器。北京时间X月X号,客户反馈网络中部分分公司访问OA系统存在1000ms以上延迟甚至丢包,导致用户偶尔会打不开OA业务或访问特别缓慢。涉及的主要配置如下:
flow-queue IDC-BRCH
queue af1 wfq weight 10 shaping 80
queue af2 wfq weight 10 shaping 80
queue af3 wfq weight 15 shaping 256 
queue af4 wfq weight 15 shaping 512
queue ef pq shaping 850 pbs 100000

acl number 3008
rule 5 permit ip source X.X.X.X 0

traffic classifier BRANCH-QB operator or
if-match acl 3008
traffic behavior BRCH-QB
remark dscp af31
traffic policy IDC-QOS-NAT
classifier BRANCH-QB behavior BRCH-QB

interface Serial3/0/1/39:0
description XXXXX
ip address X.X.X.X 255.255.255.252
user-queue cir 2048 pir 2048 flow-queue IDC-BRCH outbound

客户把ACL去掉后,出现的问题消失。

告警信息
处理过程
根据客户把ACL去掉后,出现的问题消失,初步判断为QOS的问题。
查看配置定义标记为AF3的队列为WFQ,限速shaping为256Kbps,当接口带宽为2M:
1.如果配置了shaping;是根据shaping的值来分配带宽,等于是把带宽预留,即使发生了拥塞也不会抢占带宽。拥塞的报文放入缓存PBS中,等不拥塞的时候在发送放入缓存里的报文,当缓存里报文超过PBS尺寸,就会发生报文丢弃。
2.如果不配置shaping;当接口发生拥塞,高优先级的队列可以抢占低优先级队列的带宽,当PQ带宽发生拥塞会抢WFQ的带宽。如果都是WFQ,WFQ的AF1权值为10,AF2的权值10,AF3的权值为15,AF4的权值为15,那么AF3的带宽为15/(10+10+15+15)*2M为0.6M。当AF3带宽超过0.6M后,可以抢占其他空闲的AF带宽。
3.如果只配置shaping PQ而不shaping WFQ;那么如果PQ的流量没有达到shaping值850,比如使用400,那么WFQ是可以抢占PQ的带宽。
判断把af3的限速设置过小,而突发流量过大,导致延迟丢包,把上述标红处af3队列的限制的速率改大为512kbps,问题解决。

END