[摘要]监视与测量网络路径性能是网络运营和SLA验证的重要组成部分,本文描述了端到端路径性能测量的*般性问题,并提出了利用路径的延时特性测量网络稳定性的两个指标:延时抖动有界比例系数和平均抖动/*大抖动系数,并通过实验验证了这两个参数的有效性。
近年来VoIP、VoD等实时应用在网络应用中比例大量增加,实时应用需要网络对其提供服务保证或区分服务,网络路径的延时特性和传输速率越来越受到人们的重视。网络延时和有效带宽直接反映了路径的性能和对端主机提供的服务等*水平,但它们都是随时间随机变化的变量,跟踪这些路径特征参数的动态变化可以获得资源的使用状况和性能趋势,并作为网络路径性能评价和实时的端到端性能管理的依据。
*、端到端路径性能问题
端到端性能管理的目标是为用户提供*条稳定可用的具有*定服务保障的连接。其范围已超出了流量工程和容量规划等传统问题,包括故障发现、路由选择与配置管理、流量分析等广泛的内容。对于用户而言,路径的延时特性和路径有效带宽决定了服务水平,即是否能启动*次新的连接,在局部节点获得*定的资源保证,并达到可接受的响应时间。对ISP来说,则还要关心网络路径的长期利用率、路由可达性、瓶颈带宽和其它端到端的性能等属性和参数。这些参数*般是较为稳定的,其中连通性和路径稳定性反映了路径的总体性能,而路径非对称性则影响我们对网络延时的测量。
- 连通性
连通性指的是IP网络中主机之间是否能相互到达对方,或者说*个或多个节点之间的下层连接是否可用。连通性描述了网络的可靠性,是完成网络业务的基本条件。Ping程序可用于确定网络上*个远程设备对本地系统来说是否可达,并有助于在系统之间调试连通性问题。我们可以从测量主机向网络路径的目的端定时运行ping,发出ICMP请求并等待有效的ICMP应答,从而确定网络连接的可用性,并可根据ICMP应答的类型孤立出路由选择和许多其它网络故障或问题的来源。因此,连通性是保证路径性能稳定的基础。 - 路径MTU
MTU是网络连接中允许*个物理帧传输的*大数据量,TCP/IP驱动程序需要知道这个数值以便设置合适的数据包长度,以避免出现不必要的拆分过程。不同网络的MTU缺省值不*样,以太网的标准值为1500,而多数ISP提供的拨号网络的标准值为576。理论上,只要网络连接稳定性高,MTU越大则传输效率越高。但是,如果接收机器所在网络或传输路径上路由器的MTU小的话,数据帧将不得不再次被拆分,这样反而降低了效率。因此,*化的MTU应与整条传输路径上*小的MTU值(即路径MTU)相等。RFC1191描述了路径MTU的发现机制,通过发送分组在分组头部设置不分片标志字段并判断返回ICMP错误消息实现。发送的第*个分组的长度与出口MTU相等,每次收到ICMP不能分片错误时,就减少分组长度,以下*个*小的MTU值发送。由于MTU值个数总是有限的,因此总可以找到路径中*小的MTU。所以检测路径MTU并设置系统的MTU值,可以减少对IP数据包的分段,提高路径的传输效率。 - 路由非对称性
非对称路由是指往返某*节点的路径不*致,两个方向的延时不同,由此在网络测量,特别是基于源端的测量中造成很多问题。检测路由的非对称性目前还非常困难。 - 路径稳定性
端到端路径的稳定性是衡量网络性能的关键性参数,路径稳定性可以分为路径的空间稳定性和时间稳定性。其中空间路径稳定性由路由的规模和模式决定,不稳定的路由可能是由路由不对称、循环路由、路由振荡等病态路由行为引起,也可能是连接频繁中断引起的。发生率(Prevalence) 和持续性(Persistence),分别从特定路由的发生频率和不变性方面定义了稳定性。路径的时间稳定性则强调了路径性能与时间变化的关系。本文将从路径的延时特性和传输速率出发,给出路径稳定性的评价指标,并作为网络路径性能评价和实时的端到端性能管理的依据。
二、性能指标
- 路径延时稳定性参数
设测量的延迟变量为X, 为t时刻测得的网络延时,则 为 间隔内的延时变化。若在 时间段内每次测量的样本值为 ,则这组延迟样本集的样本方差为 , 其中 = 。假设 为SLA(service level agreement)规定的或是某种应用服务质量要求的网络延时抖动目标临界值。根据在 时间段延时的抖动程度,定义延时抖动有界比例系数为:*般 可取为 。延时抖动有界比例系数反映了相邻两次测量之间延时抖动小于 情况所占的比例,*般设定当 时,认为连接有较好的稳定性, 越大,即 越接近1,连接越稳定。但延时抖动有界比例系数不能反映*大延时抖动,由于排队延时随背景流量而出现较大的波动,定义如下形式的平均抖动/*大抖动系数:设定 时,认为连接有较好的稳定性, 越大,连接越稳定。综合以上两个参数,当路径同时满足 和 时,确定该路径是关于延时稳定的。 - 路径速率参数
路径延时稳定性参数反映了链路整体运行的稳定程度,但不能反映不同链路速率的差别。某*条链路可能延迟较大,但延时抖动较小,丢失率很低,这时仅由路径延时稳定性参数难以反映链路的实际传输质量。通过采集SNMP网络设备MIB接口组数据,可以计算接口数据传输速率V:,其中 分别为在 内接口接收与发送的总字节数。通过连续采集路径中多个接口的流量数据,将*小的接口传输速率 作为路径速率参数通知给用户,以反映当前路径的实际传输性能。 - 数据采集
我们选择实验室的测量主机到湖南大学DNS服务器作为实验对象,该路径经过两个路由器,分别通过100M Ethernet和1000M Ethernet链路相连。我们使用Ping采集了近两天的每10ms*次测量的延时数据,并通过读取第*个路由器MIB库获得了每5ms的接口速率数据。
三、端到端路径性能的测量
我们采用以上测量方法基于以下原因。通常,网络性能参数的测量采取主动测量的方法,即在指定的路径上按*定规则发送探测性流量数据来测量网络上某*主机是否可达(reachability)、网络延迟、网络中包丢失情况和网络吞吐量等链路性能参数或测量网络路径的跳数、路由抖动、路由对称性等从源端到目的端的路由信息。主动测量会在网络中引入较多的测量流量,对网络实际性能会造成*定的影响。
由于路径带宽的测量需要向网络发送大量的分组数据,耗费大量有效带宽,这使得以主动方式测量带宽对用户应用和网络都*具损害性。而使用SNMP可以定时查询网络设备接口的流量速率数据,结合SNMP与网络往返延迟的测量评价路径性能,可使测量发送的分组数降到*低。
- 延时分布数据分析
测量获得的延时数据的分布可以看出延时分布RTT的测量值很不稳定,延时值*高达到了25.198ms,*低为2.091ms,接近于固有延时。但大部分散点集中于10ms的上下5ms范围内,只有*少数点落在大于20ms小于5ms范围,说明路径相对较为稳定。计算延时抖动有界比例系数 ,平均抖动/*大抖动系数 ,与实际网络运行状况基本相符。 - 延时抖动数据分析
40小时中每十分钟测量的延时抖动的分布延时的抖动分布来看,在取网络延时抖动目标临界值 为 =4.629ms时,*坏情况下达到抖动的边界16ms,远远超过了期望的 值。这说明该路径对于实时应用是不可能达到很好的性能的。 - 链路接口速率分析
同时采集的路由器MIB库接口流量速率数据可以看出该路径的利用率*低,特别是流出速率很小。在实际中可以用加大负载的办法提高网络的利用率,计算链路接口可以达到的*大的数据传输速率。