扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
通常情况下,我们会对链路流量进行长期监测,但是如何评价它会有一些问题。
简单的统计方法,可能很难得到满意的结果。例如统计过去一段时间的平均利用率,但平均值可能和峰值离的很远;统计过去一段时间的峰值,但峰值不能反映长期的平均水平;统计过去一段时间的峰值出现频度,但难以识别其规律,难以估计未来的发展趋势。
实际的解决可以采用序列分析的方法,把事物的发展看成趋势、周期、随机三类因素影响的总和。如下图。
使用多次移动平均(Moving Average),可以将周期、趋势和随机因素解耦。移动平均的具体方法是,对于一个序列,以N为周期,向前遍历求平均值得到一个新的序列。如下图,a1-a7是原始序列,周期N=3,b5是a5、a6、a7的平均值。
通常网络中的一些参数(如链路流量),通常是以天或周为周期的因素变化。所以,相应的可以以天为周期作移动平均来消除一天中的波动,或者以周为周期作移动平均来消除一周中的波动。
如下图是一个具体的例子,一个实际的链路流量图,通过每两小时采一次端口平均流量(Bytes/Sec),连续采集两个月(如 8月22,12:00 p.m.-10月22,12:00 p.m.)共732个采样点绘出。其中横轴是两个月的时间,纵轴为端口流量值。
从上图中可以看到:每天的双峰波动规律较为明显;每周似乎可以看到一定的波动;而从10月4日到6日有一个明显的链路流量高峰,在两个月中的其它时段是没有的。
对上面的统计图做分析可以采取如下的方法和步骤。
1.以一天为周期做移动平均,消除一天中周期波动的影响,如下图。
图中蓝线为原来的统计曲线,红线是做平均移动后得到的曲线,从红线中可以看到明显的以星期为周期的规律(中间10月4日到6日为特例)。
2.进一步以周为单位做移动平均,消除一周中周期波动的影响,得到长期的趋势。如下图。从图中可以看到长期的平稳的趋势。
3.除去长期趋势的影响,可得到只含每天周期和随机因子的曲线,如下图。图中,横轴为时间轴(两个月),纵轴为各时刻实际采样值与以天为周期移动平均后的值(可参考前图)的比。该图反映了一天内各时刻值和移动平均值相比的波动状况。
在上图的基础上,对每天同一时段的波动因子取平均,得到一天内不同时段的周期影响因子,如下图。
4.同理,还可以计算出一周内各天的周期因子,如下图。
5.到现在,我们已经得到了趋势图和周期因子(一天的和一周的)。除去趋势和周期因素的影响,则得到随机因子,如下图。
可以用统计的方法验证其随机性,以说明我们对周期因子提取的比较全面,该序列的标准差为0.032,即平均有3.2%的波动。
6.对趋势进行拟合,拟合时剔除异常情况的影响,可得到回归拟合后的趋势图,如下图。
在上面回归拟合趋势图的基础上,结合周期、随机因子进行外推,可得出未来两周内的推算流量图,如下图。
上图中,蓝色曲线部分为(10月22日)之前一段时间的实际采样图,红色虚曲线为推算的未来两周流量图,上边的绿色虚线为包络线,是在前面的平均波动值3.2%乘三之后绘出的波动上限。一旦哪一时段的实际流量值超出了绿色包络线,则可认为是出现了重大事件或者是有一些方面(如业务模式、网络路径)做出了人为的改变。
上面介绍的这种分析方法的主要目的是掌握链路流量的平均水平和变化规律,可以用它来进行短期的预测,但预测的结果仅仅作为一个参考,因为网络之外的很多重要因素好是不可控的,如新业务上线、网络结构变化、病毒爆发等,这些影响可轻易地突破预估范围。
但是,通过这种趋势估计,一旦实际情况与估计出现较大偏离,我们可以认为一定有不寻常的事件发生了,比如实际情况中的10月4日到6日出现的高峰。结合Cisco Netflow技术,对主要应用的带宽使用情况进行趋势分析和预测,则可以达到更好的容量规划效果。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者