扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
随着大量传统的基于电路交换技术的应用逐渐由基于分组技术的IP/MPLS网络或以太网承载,分组交换网和电路交换网之间的边界正在消失。然而,在这一网络演进过程中,许多传统电路交换网能够支持的运行、管理和维护(OAM,Operation,Administration and Maintenance)功能,在基于分组的网络中却难以实现。
MPLS最初是为了提高路由器的转发速度而提出的一个协议。近年来,由于MPLS很好地在流量工程(TE,Traffic Engineering)和VPN服务中得到了应用,该协议已经日益成为扩大数据网络规模、提高网络可运营能力的重要标准。本文将重点讨论MPLS网络中 OAM的相关问题,以及故障检测这一最基本的MPLS OAM功能的实现方法。
MPLS网络中OAM功能的基本内容
MPLS层网络的OAM功能主要包括以下内容:
(1)控制平面和数据平面OAM功能的分离:OAM分组应经由数据路径传送。
(2)失效LSP的检测:包括相同代价多径缺陷的检测,以及独立于用户流量,并在用户投诉前完成的缺陷检测。
(3)缺陷检测和恢复:这里的缺陷包括LSP连通性丢失、具有并发LSP重路由功能的LSP服务降级、交换LSP缺陷、某一LSP流量复制到另一个LSP的缺陷检测,以及成环缺陷等。
(4)失效LSP的缺陷定位。
(5)LSP的描述和分层:由于LSP可能会嵌套使用,因而需要对嵌套LSP进行相应的管理。
(6)LSP缺陷通告:在多层网络应用中,告警抑制功能需要在LSP端点与其他类型的缺陷通告技术(如ATM和SDH/SONET中的缺陷通告技术)进行必要的互操作。
(7)SLA的度量和测量:特别是业务的可用性、流量传送的时延和抖动,以及流量丢失等的度量和测量。
(8)恢复:对于某些业务来说,通常要求网络具有从失效中自动恢复的能力。
(9)对拒绝服务(DOS,Denial of Service)攻击的检测。
此外,为了使MPLS网络具有较强的可扩展能力,OAM功能应当简单且易于配置、能够前向兼容网络中已有的LSR,并能够在劣化的网络和链路条件下实现。最终,MPLS OAM功能将在不同的管理域(如用户和运营商的管理域)中运行。
MPLS故障检测概述
控制平面和数据平面的分离
控制平面和数据平面的分离直接与OAM分组的格式及分组处理方式相关。为了区分MPLS OAM分组和数据分组,ITU-T Y.1711规范使用了一个具有两层标签的标签栈。栈顶标签的数值与用户分组的标签(即数据传送所使用的标签)相同,以确保在大多数情况下OAM分组的传送路径与用户数据分组的传送路径相同。第二标签采用了一个特殊的数值14,以将OAM分组与用户数据分组区分开来。然而,第二标签的引入可能会使相应的处理机制无法与现有的负载均衡算法完全兼容,因而使采用ECMP(Equal Cost Multipath)协议的网络无法正常工作。
混合模式是另一种分离控制平面和数据平面的方法。在混合模式中,可以通过使用一个特定的标记来识别OAM分组,或使用分组中某一特定的字段,以使相应分组的识别更容易。虚电路连接确认(VCCV)就是采用混合模式的一个例子。
失效LSP的检测
除了采用网络失效/定位机制外,还需要使用特定的分组流来对LSP失效事件进行测试。这是因为在许多情况下,即使网络(链路或节点)并没有失效,分组流也可能被中断。造成这种状况的原因可能是路由/转发表出现问题、标记绑定被破坏或网络拥塞等。连通性确认、Ping/追踪路由等类型的OAM功能适用于这种类型的故障检测。由于依赖的分组技术不同,上述协议的实现也不一样。但无论采用何种分组技术,最重要的是OAM分组应采用与正常数据分组相同的传送路径。
LSP缺陷的典型场景
近年来,ITU-T和IETF均在LSP故障检测和恢复的标准化方面开展了大量工作,并分别开发了不同的实现机制。ITU-T Y.1711规范了连通性确认(CV,Connectivity Verification)功能,而IETF则正在定义双向前向探测(BFD,Birectional Forwarding Detection)机制。MPLS网络中不同类型的失效场景主要包括:连接的简单丢失、错连(Misconnection)、交换连接(Swapped Connection)、错误聚合(Mismerging)和循环/无意识的分组复制(Loop/ Unintended Replication)。
ITU-T规范的故障检测机制——连通性确认CV
CV功能的基本思路是周期性地从入口LSR向出口LSR发送测试分组(CV分组)(如每秒发送一次),这些分组具有相同的入口LSR标识和源LSP.出口LSR通过分析接收到的CV分组中的标识信息来检测是否发生失效事件。
除CV机制外,新一版ITU-T Y.1711标准补充规范了快速失效检测(FFD,Fast Failure Detection)机制,以帮助实现更快速的保护倒换。FFD的功能与CV相同,但FFD以更短的时间间隔发送OAM分组,以更快速地检测到缺陷事件。
IETF规范的故障检测机制——双向前向探测
IETF定义了双向前向探测(BFD,Bidirectional Forwarding Detection)机制,希望以较低的开销,快速地在两个网元之间的前向路径上进行失效检测。由于BFD定义的确认分组可以用于任何协议层,这使BFD 机制成为了一个通用的工具。BFD可以在多种类型的路径和媒质(如物理链路、虚电路或一对网元之间的MPLS LSP)上实现失效检测。为了建立或拆除BFD会话,或确保会话的参与方能够随时了解状态的改变,BFD协议采用了三次握手的交互方式。
应用于MPLS网络时,BFD会话可以建立在与MPLS LSP相关联的每一个转发等价类(FEC,forwarding equivalency class)上。建立会话可以采用LSP Ping协议,相关参数(如定时器和检测失效速度)在会话建立之初协商确定,并可以在会话进行期间由运营商动态改变(如提高或降低检测失效速度)。
对于任何检测协议来说,都需要正确地选择相关参数,如定时器和探测分组的发送频率。BFD机制的最大优点在于它能够精细地调整这些参数,以适应用于上述两种模式时的特定的检测标准。
与CV 和BFD这两种缺陷/故障检测方法相对应,我们还可以配套使用两种缺陷/故障分析方法:MPLS LSP Ping和MPLS LSP追踪路由(Traceroute)。显然,前后两种机制的作用是互补的,CV和BFD机制首先负责检测缺陷,而Ping和追踪路由机制则负责进一步分析缺陷事件,对缺陷进行定位。
限于文章篇幅,本文仅介绍了MPLS OAM的基本情况,以及MPLS OAM机制中有关故障检测方面的内容,完整的OAM机制还包括故障分析、故障恢复、业务性能的度量和测量等。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。