网络级丢包统计原理
所谓丢包统计是指在某一个测量时间区间内,根据所有进入网络的流量与离开网络的流量之间的差,获得丢包数量和丢包率数据。以图5-11所示的网络为例,从网络设备Ingress方向接口进入网络的报文数记为PI(n);从网络设备Egress方向接口离开网络的报文数记为PE(n)。所有进入网络的流量之和PI=PI(1)+PI(2)与离开网络的流量之和PE=PE(2)+PE(3)之间的差,即是网络在该时间内的丢包数量。
iPCA在实现丢包统计时,用户可以指定测量时间区间,在测量时间区间内,采用特征分组测量法来实现丢包统计。所谓特征分组测量法是指在源端报文入口处,对业务报文头中指定染色位进行周期性的标识(置位、复位),将测量时间区间划分为不同的测量周期,基于测量周期统计网络的丢包数据。
测量时间区间的范围可以是无穷大,即使能丢包统计功能后,统计功能一直生效,直到用户去使能该功能。用户也可以自定义测量区间的时间范围,取值可以是5、10、15或者30分钟。缺省情况下为10分钟。
测量周期的范围用户也可以自定义,取值可以是1、10、60或者600秒。缺省情况下为10秒。
以图5-11所示的网络为例阐述设备是如何通过特征分组测量法实现丢包统计的。在该网络中目标流从Switch_1和Switch_2进入,从Switch_2和Switch_3离开。图5-12所示的是一段时间内报文从进入网络到离开网络时各个设备上的特征分组测量法的实现情况。其中tn表示绝对时刻,tn~tn+4(n≦4)为一个测量周期。
- t0时刻:Switch_1对入口业务报文的染色位置1,计数器开始计数本周期内发送的染色位置1的业务报文数。
- t1时刻:Switch_2对入口业务报文的染色位置1,计数器开始计数本周期内发送的染色位置1的业务报文数。
- t2时刻:经过网络转发及延迟后,Switch_2出口收到本测量周期内第一个染色位置1的业务报文,计数器开始计数。
- t3时刻:经过网络转发及延迟后,Switch_3出口收到本测量周期内第一个染色位置1的业务报文,计数器开始计数。
- t4时刻:Switch_1对本测量周期内入口染色位置1的业务报文计数结束,得到本周期内发送的染色位置1的业务报文计数为PI(1)。
- t5时刻:Switch_2对本测量周期内入口染色位置1的业务报文计数结束,得到本周期内发送的染色位置1的业务报文计数为PI(2)。
- t6时刻:Switch_2对本测量周期内所有染色位置1的业务报文计数结束,得到本周期接收到的染色位置1的业务报文计数为PE(2),在Switch_2出口处报文的染色位标志被去除。
t7时刻:Switch_3对本测量周期内所有染色位置1的业务报文计数结束,得到本周期接收到的染色位置1的业务报文计数为PE(3),在Switch_2出口处报文的染色位标志被去除。
本测量周期内,由于网络拥塞等原因,Switch_3少收到了一个染色位置1的报文,出现网络丢包。
本测量周期内报文丢包数LostPacket=PI(1)+PI(2)-PE(2)-PE(3)。丢包率LostPacketRate=LostPacket/[PI(1)+PI(2)]。
为了保证统计结果能准确的描述同一时间范围内的丢包情况,无论是接收端还是发送端,都必须保证对测量时间的标记使用相同的标准,以保证统计获得的数据是同一个时间范围内的数据,因此设备间的时间同步是网络级丢包统计的前提。配置iPCA前,可以先配置NTP实现各交换机上的时间同步。
NTP是一个普遍适用的网络时间同步工具,大部分交换机设备都支持NTP。iPCA测量周期一般选择为秒级,按照目前NTP的同步精度(50ms),可以保证测量结果的准确性。有关NTP的具体内容请参见《S9300, S9300X V200R019C10 配置指南-设备管理》 NTP配置。