扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
1 引言
互联网技术的高速发展及人们对信息处理的迅猛需求加速了数据中心在各个行业的部署与应用,数据中心这种集中式的应用便利了数据的存储与共享、增强和整合业务系统的应用、网络安全管理、数据容灾与备份等。但在部署数据中心解决方案时,有一个重要的问题不容忽视——拥塞控制:用户的随机访问性使得某一条链路或某一路服务产生拥塞,拥塞的结果就会使得业务应用变慢,甚至失败。
2 数据中心及拥塞机制分析
数据中心应用的典型特征就是业务应用的汇聚与集中,利用高性能的交换机/路由器构建数据转发与交换核心及接入网络,连接起终端用户和业务应用系统。数据中心部署中,应用系统处理能力可以预计且加以增强,数据通信及交换系统也可以扩充以增加更多的带宽,但是仍然无法避免多路用户访问而造成网络拥塞,这种拥塞是随机且不可避免的:一些用户可能通过交换机下载文件,另外一些用户也可能通过同样的端口进行数据计算,当需求的带宽超过端口的转发能力时,拥塞就会产生。
当拥塞产生时,用户的直接感受就是业务应用或资源访问变慢,甚至失败;从传输层TCP/UDP来看则是报文延时、重传甚至丢失;而在MAC链路层,数据包因为拥塞就会被缓存、排队,也可能因为队列满而被丢弃。因此,由于拥塞不能避免,对于交换机的缓存管理及拥塞处理能力要求相当重要,它能使拥塞发生时对业务及用户的影响风险减到最小。
3 交换机/路由器拥塞分析
交换机/路由器端口间的链路通常都能达到线速,常规的L2/L3测试已经覆盖了这些项目,但如果访问存在多对一的情况,如12个GE端口的入口流量流向1个10GE出端口,出口会发生拥塞,在L2/L3的测试表现上,出口带宽还是在10G的速率上;但在应用层的表现上,应用层业务的有效带宽肯定会明显降低。当DUT因为拥塞发生丢包时,应用层业务如TCP就会存在等待、延时及重传等相关的数据保护措施,这些重传及等待不仅造成有效带宽降低,产生了大量的无效带宽,而且使得L2/L3的转发能力降低,浪费了链路的带宽。而且,拥塞越严重,有效带宽降低越明显。
目前的交换机/路由器设备基本上是属于存储转发方式(Store and Forwarding/LIFO),报文进入设备后,从一个芯片的缓存转发到其它芯片上的缓存(如果基于NP/CPU转发,就会多了一层CPU的队列转发),再从缓存中进入转发队列,并从目的地端口上转发出去;缓存的分配包括配置到端口的缓存及公共缓存。设备缓存的大小及队列调度能力会体现在对于拥塞的处理能力上。这种能力不仅仅表现在拥塞的处理上,而且报文在缓存中的排队效率也会影响应用层的性能。通过增加缓存可以减小拥塞时处理能力,但这方面会增加硬件成本。另外,过多的缓存会增加报文转发的时延,从而也会影响应用层的性能。缓存及漏斗的粒度控制也会对不同帧长度的报文转发存在不同的影响。缓存的分配与队列管理要基于效率与公平的原则,既要保证端口拥塞处理的性能需要,也要保证严重拥塞产生时不相关的端口被阻塞甚至得不到调度而饿死。
4 拥塞处理能力评估
如何评估测试设备的拥塞处理能力及队列调度能力?传统的测试方法包括RFC2544的Back-to-Back,RFC2889的Congestion Control Test,但这些传统的L2/L3测试手段首先只能是局部地测试设备的几个端口,另外测试结果也只是一个量值,无法将其跟真实的业务表现关联起来,而且难以与同类产品进行比较。
在数据中心的实际应用中,最重要的是用户体验,也就是用户的真实感受。传统的测试情况下,设备测试的结果是一个测试很好的指标,而到用户真实应用时,可能会是一个糟糕的情景。因此,改正测试方法,直接采用真实的业务进行测试,尽量接近用户行为和体验,让测试变得更加真实,是一个发展方向。通过真实的FTP/Http L4~L7层业务,根据测试的最终有效带宽就可以得出设备在真实应用中的转发性能情况,所见即所得。事实上,目前在数据中心的验收或选型测试中,对于拥塞性能或缓存性能的测试比较流行的方法是:通过部署大量的服务器连接交换机/路由器设备,并在服务间运行真实的业务,如FTP或Iperf软件,来测量最终的有效带宽。
5 TestCenter HyperMetrics CM板卡的真实性测试
通过构建大量的服务器连接DUT(交换机/路由器),并在拓扑造成DUT发生拥塞,这是一种真实的L4~L7应用测试模型,也是一个很好的测试方法。但对于设备厂商来说,在实验室中摆开几十台服务器来测试这项功能,不仅管理起来费事,而且没法移动和复制,从成本上来说也是一项不小的投资。
Hypermetrics-CM板卡则能提供一个很好的测试方案:首先CM卡能够产生真实的应用层业务,CM卡上的端口既可以模拟成大量的服务器以供真实的PC客户端访问,也可以模拟大量的客户端去访问真实的服务器,且应用层协议栈的实现与真实的业务一致;其次,CM卡能产生GE线速的应用层流量,满足了测试中的高带宽要求;再者,多达12个端口的高密度CM卡则能够同时模拟12台Client/Server,解决了测试中的大规模部署问题。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者