扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNET至顶网网络频道 7月10日 综合消息(文/郝卫国):在云计算时代下,数据中心内部一般采用分布式架构处理海量数据存储、挖掘、查询、搜索等相关业务,服务器和服务器之间需要进行大量的协同工作,在服务器之间产生了大量的东西向流量。其次,数据中心普遍采用虚拟化技术,虚拟化的直接后果是使单位计算密度极大提升,物理服务器吞吐量将比虚拟化之前成数倍提升。还有为了更大幅度地增大数据中心内业务可靠性、降低IT成本、提高业务部署灵活性、降低运维成本高,需要虚拟机能够在整个数据中心范围内进行动态迁移。
上面这些是云计算时代下的数据中心业务需求,这些需求促进了数据中心网络架构的演进,催生了大二层网络架构的诞生,TRILL便是一种构建数据中心大二层组网的技术。
本文旨在分析云计算时代下数据中心对网络架构的需求,并提出华为基于TRILL的解决方案,帮助用户在建设数据中心网络时,能选择合适的网络解决方案以更好满足云计算业务需求。
云计算时代下数据中心对网络架构要求
• 虚拟机任意迁移
作为云计算的核心技术之一,服务器虚拟化已经得到越来越广泛的应用。为了更大幅度地增大数据中心内业务可靠性、降低IT成本、提高业务部署灵活性、降低运维成本高,需要虚拟机能够在整个数据中心范围内进行动态迁移,而不是局限在一个汇聚或接入交换机范围内进行迁移。
传统数据中心一般采用二层+三层组网架构,POD内采用二层组网,POD间通过三层网络进行互联。VM只能在一个POD内进行迁移,如果需要跨二层区域迁移,需要更改VM的IP地址,如果没有负载均衡器LoadBalance屏蔽等手段,应用会中断。
在云计算时代,为提升大量闲置服务器的资源利用率,计算虚拟化技术已经逐步在IDC进行应用。IDC运营商为了更充分的利用数据中心资源,VM需要更大的迁移范围,可以通过TRILL构建的大二层网络来实现。
• 无阻塞、低延迟数据转发
云计算时代下的数据中心流量模型和传统运营商流量模型不同,数据中心中主要是服务器和服务器之间的东西向流量,数据中心网络相当于是服务器之间的总线。
为保证业务正常开展,需要支持网络数据的无阻塞、低延迟转发,网络组网支持扁平化胖树组网拓扑,对于交换机之间多条数据转发路径能够充分利用。传统二层组网情况下,需要借助xSTP进行破环,防止二层环路风暴,N条链路只有一条可以转发,带宽利用率低,已经满足不了云计算时代下数据中心网络的要求。
• 多租户
云计算时代下一个物理数据中心不再被一个租户所独享,而是可以同时被多个租户同时使用,每个租户对应一个虚拟数据中心实例,每个租户仿佛享有独有的服务器、存储、网络资源,租户之间数据流量需要进行隔离,目前传统二层组网情况下租户规模受限于VLAN数量限制,至多4K。随着云计算的发展,未来数据中心网络架构租户规模要能够突破4K限制。
• 网络规模大
对于云计算时代下的大型数据中心来说,支持的服务器要能够达到十万甚至百万级别,为了实现无阻塞转发,网络规模要能够达到几百台、上千台交换机,在这种大规模组网情况下,组网协议要能够有效避免环路。网络内部的节点和链路故障,要能够触发整网快速收敛,业务迅速恢复。网络维护简单,方便用户业务部署。
TRILL组网技术特点
Trill(Transparent Interconnection of Lots of Links)是IETF标准组织制定的一项标准技术,通过扩展IS-IS路由协议实现二层路由,它具有以下特点:
• 高效转发
Trill网络中每台设备都以自身节点作为源节点,基于最短路径算法计算到达其他所有节点的最短路径,如果存在多条等价链路,在生成单播路由表项时候能够形成负载分担。对于数据中心胖树组网等存在多路径转发时候,能够充分利用网络带宽。相比通过xSTP进行破环的传统二层网络,TRILL相当于是数据转发的”多车道”,传统二层网络只是”单车道”。
由于TRILL网络中数据报文转发可以实现ECMP和最短路径,因此采用TRILL组网方式可以极大提高数据中心数据转发效率,提高数据中心网络吞吐量。
• 有效环路避免
TRILL协议能够自动选举出分发树树根,每个RB(Router Bridge)节点以分发树树根为源节点,计算到达所有其他RB节点的最短路径,从而能够自动构建整网共享的组播分发树,基于该共享树将整网所有节点连接起来,承载二层未知单播、广播或组播数据报文,不会形成环路。
在网络拓扑变化情况下,节点之间路由收敛有可能不一致,通过RPF检查可以丢弃从错误端口收到的数据报文,避免环路。并且由于TRILL头部有Hop-Count字段,能够进一步减少临时环路的影响,从而能够进一步有效避免环路风暴,从这个角度来讲有效环路避免也是TRILL支持大二层网络的原因之一。
• 快速收敛
传统二层网络由于ETH头部没有TTL字段,xSTP协议收敛机制设计的比较保守,在网络拓扑变化情况下,收敛速度比较慢,有的情况下甚至需要几十秒时间才能收敛,不能满足数据中心业务高可靠性要求。TRILL采用路由协议生成转发表项,并且TRILL头部有Hop-Count字段能够允许短暂的临时环路,在网络出现节点和链路故障情况下收敛时间比较快。
• 部署方便
TRILL网络部署自动化程度比较高,首先TRILL协议配置比较简单,很多配置参数比如Nickname、systemID等都可以自动生成,多数协议参数采用缺省配置即可;其次,单播、组播统一控制协议,用户只需要维护一套协议,而不是象三层组网中单播和组播需要维护IGP、PIM等多套路由协议;最后,TRILL网络还是二层网络,具备传统二层网络即插即用、方便易用的特点。
• 容易支持多租户
目前TRILL标准采用VLAN ID作为租户标识,通过VLAN对不同租户流量进行隔离,在云计算产业和大二层组网运营处于起步阶段,VLANID的4K限制不会形成瓶颈。随着云计算产业的发展,租户标识需要突破4K限制,TRILL后续会演进到通过FineLabel来进行租户标识,FineLabel为24bit,理论上能够支持16M租户规模,足够满足将来租户规模扩展性的需求。
• 平滑演进
采用MSTP传统二层ETH技术的网络,可以无缝接入TRILL大二层网络,MSTP网络下挂接的服务器可以和TRILL网络下挂接的服务器彼此进行二层通信,VM可以在整个大二层网络内迁移。
总体上来说,由于TRILL具有高效转发、有效环路避免、快速收敛、部署方便、容易支持多租户等特点,基于TRILL技术构建的网络架构能够很好的满足云计算时代下数据中心业务需求。
华为基于TRILL的大二层解决方案
华为TRILL解决方案如下图所示:
通过TRILL构建的大二层网络,VM可以在整个DC范围内实现大范围动态迁移。TRILL网络相当于是数据中心的总线,为了很好保证数据中心业务开展,要能够将服务器和服务器之间、服务器和internet用户之间的流量进行高效转发。
特性和优势
TRILL作为数据中心网络中的高速公路,特点如下:
• 组网方式灵活,支持EOR和TOR两种组网方式
CloudEngine全系列交换机都支持运行TRILL协议,所有单板都能够支持TRILL转发,能够支持TOR和EOR两种组网方式,给用户组网带来了很大的灵活性。而且为增加接入设备的可靠性,接入设备支持堆叠。
TRILL协议能够覆盖到数据中心网络的最边缘设备,对于整个数据中心来说TRILL网络真正相当于是一个Bridging Fabric,核心网络架构稳定。随着云计算业务发展,用户将来可以很方便的扩展增加物理服务器、IPV4/IPV6网关、防火墙、负载均衡设备等。
• 网关部署灵活
支持两种网关部署方式:
1、 独立三层网关。三层网关和核心RB之间直连,如果数据中心规模很大,可以部署多台网关,基于VLAN做负载分担。
2、 三层网关和核心RB设备合一。通过虚拟化VS(Virtual Switch)技术,将核心RB划分为两个VS,一个VS运行三层网关功能,一个VS运行TRILL协议功能。
Internet用户和数据中心虚拟服务器之间的数据流量、数据中心内部跨网段流量,都需要经过网关进行转发,网关的设计会直接影响数据中心内南北向流量、跨网段的东西向流量转发性能。
对于中小规模数据中心,可以采用三层网关和核心RB设备合一的方案;对于较大规模数据中心,可以采用独立三层网关方案。用户可以根据自己的业务需求,灵活选择相应的网关部署方案。
• 丰富的运维管理手段
CloudEngine全系列交换机支持丰富的运维管理手段。CLI、SNMP、Netconf类型的网络管理员可以通过TRILL网络登陆RB设备的VLANIF接口进行配置管理,管理网络可以和TRILL业务网络共用一张物理网络。对于TRILL网络内部路径连通性,支持trill ping手段进行故障定位。
• 支持分发树数目多
对于TRILL单播流量可以根据ECMP算法实现链路级别的严格的负载分担,对于组播流量Ingress RB节点通过为相应VLAN选择不同组播分发树,实现链路级别的组播流量负载分担。另外,通过CloudEngine全系列交换机构建的大二层网络,整网能够支持多达4颗分发树,可以使不同树根节点的组播流量处理压力大大减小,并且能够实现整网组播流量细粒度的负载均衡。
• 网络规模大、性能优
通过CloudEngine全系列交换机能够构建超过500个节点的超大规模二层网络。网络链路和节点故障收敛时间在500ms以内,最大支持16路负载分担,能够满足大规模数据中心对于网络规模和性能的要求。
• 支持两种DC演进方式
方式一:若原有DC采用传统MSTP二层ETH技术进行组网,后续扩容设备支持TRILL组网方式,CloudEngine全系列交换机能够无缝接入传统MSTP网络,从而将新旧设备纳入统一的大二层网络,最大程度保护用户投资。
方式二:通过灵活指定用户VLAN接入的网络类型,可以实现运维方式的平滑演进。新建DC采购设备支持TRILL,但是由于用户大二层运营经验不丰富,初始可以只在少数VLAN内进行业务试点,大部分业务还是通过传统MSTP技术进行运营,后续随着大二层运维经验的丰富,所有业务都切换到TRILL网络中。
结束语
总之,TRILL网络相当于数据中心中的高速总线,能够满足云计算时代下虚拟机任意迁移、无阻塞、低延迟数据转发、多租户、网络规模大等要求。华为公司愿意同业界一起,共同推进TRILL标准技术在数据中心中得到更广泛的应用、共同推进TRILL标准技术的进一步发展和演进。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者