进入2l世纪,IP网络上的信息越来越多,人们对信息的需求也越来越多。尽管IP网络的传输带宽越来越宽,用于存储内容信息的服务器性能和容量越来越高,但人们依然抱怨信息网络的传输速度低,获得的信息不够准确、不够快。
1、概述 进入2l世纪,IP网络上的信息越来越多,人们对信息的需求也越来越多。尽管IP网络的传输带宽越来越宽,用于存储内容信息的服务器性能和容量越来越高,但人们依然抱怨信息网络的传输速度低,获得的信息不够准确、不够快。造成这种现象的原因是作为信息存储媒体的服务器性能(存储容量、存取速度)的提高速度赶不上众多用户提取信息的需求。目前,视频信息占IP网络上传输信息总量的很大一部分。为了解决这个困扰业界的内容分发问题,研究人员尝试采用各种方式。本文将从信息业务存在的问题入手,介绍几种IP网络上的内容分发技术。
2、IP网络上的信息服务存在的问题 与PSTN主要提供交互式端对端对称的电话业务不同,IP网络主要提供服务器到客户端的非对称数据业务。IP网络上的信息服务方式基本上是由用户向存储有各种信息的服务器申请其希望得到的信息,由服务器根据用户的请求向用户发送其欲得到的信息内容。IP网络上最受用户欢迎的Web业务是一种基于服务器/客户端的业务,其业务模型如图1所示。
图1 以服务器/客户端方式提供信息服务的业务模型
从图l中可以看出,在每一个web网站存储有不同信息内容的情况下,由于IP网络本身访问的无地域性和距离性,分布在世界不同地点的用户均可以到相同的服务器中访问内容,这样一方面会造成服务器本身的处理速度的瓶颈,另一方面会造成骨干网络业务量的拥塞。
VOD业务是一种主要向用户提供视频信息的Web业务,由于其信息服务器中所存储的信息以视频信息为主,因此处理速度及拥塞问题尤为突出。为解决这两个问题需要有很好的内容分发技术。简单的思路便是将作为信息源的服务器分布式配置,使用户尽可能地“分散”访问,以减轻个别服务器和局部骨干网络的压力。但是,将信息源分布放置后,会出现如何管理内容信息在这些服务器中的存放,用户如何找到其欲访问的信息源的问题。
3、内容分发技术 基于客户端/服务器方式的非对称的数据业务的大量应用,会造成网络不同方向和不同局部的业务流量的不平衡,特别是服务于所有用户的服务器的压力尤为突出。为此人们便开始研究各种解决IP网络内容分发问题的技术。下面主要介绍用于内容分发的CDN技术、组播技术和端到端下载技术。
3.1 CDN技术
CDN是构建在IP网络之上的内容发布网络,其主要目的是通过该网络的构建减小IP骨干网络的传输压力,将连接到IP网络上的内容信息更迅速地分发到全球范围内连接到IP网络上的用户终端。CDN技术最先应用于全球范围内最受欢迎的Web网站。如图2所示,CDN网络主要由初始服务器、分布在网络“边缘”的缓存服务器、重定向DNS服务器和内容交换服务器组成。其中,初始服务器负责完成生成服务器信息内容;缓存服务器负责存储初始服务器的部分或全部信息内容;为用户进行地址解析的DNS服务器判断出用户所访问的网站采用了CDN技术进行内容分发时,将用户申请内容解析用的URL信息转发给重定向DNS服务器,重定向DNS服务器根据接收到的URL信息、转发URL的DNS服务器的地址信息以及网站在构建CDN时缓存网站的配置情况,将距离转发URL的DNS服务器最近的缓存网站的IP地址发送给DNS服务器,DNS服务器再将接收到的IP地址信息转发给用户,最终用户利用所接收到的IP地址完成与其“较近”的缓存网站的连接,通过接受“就近”的缓存网站所提供的服务达到减轻骨干IP网络的传输压力、提高服务质量的目的。
图2 CDN组网示意 CDN的内容交换服务器和内容管理服务器为选用部分,其中,内容交换服务器主要配置在一个物理地点具有较多的缓存服务器情况下,完成各缓存服务器之间的负载均衡等功能;内容管理服务器主要完成整个CDN中各缓存服务器中存储的内容的管理,为各缓存服务器制订各自相应的缓存策略,以提高缓存服务器的服务质量。
目前,IETF在CDN方面已陆续发布了一系列相关的标准,主要的标准有:
IETF RFC3040(2001)Internet Web复制和缓存分类、IETFRFC3466(2003)内容互联(CDI)模型、IETFRFC3568(2003)已知内容网络(CN)请求路由机制、IETF RFC3570(2003)内容互联(CDI)场景等,分别规定了CDN(CN)的模型、应用场景、复制和缓存分类以及请求路由机制等方面的技术内容。
虽然CDN技术已经应用于Web网站和VOD业务等方面来解决内容分发问题,已经有一些可以商用的设备,但从技术的角度上来讲还有一些需要改进的方面。例如:在重定向方面包括有DNS重定向和最短接收时间重定向两种方案,采用DNS重定向服务器实现重定向时,实际上最终选定的缓存网站是距离为用户进行地址解析的DNS最近的网站,而不是距请求用户最近的网站;采用最短接收时间重定向方式是指用户向所有的网站发送请求,最先接收到响应的网站被认为是距离用户“最近”的网站,但由于IP网络本身的信息流量的不确定性,最先到达的响应信息并非一定来自距离用户“最近”的网站。另一个问题在于内容存储策略,目前还没有一种非常有效的缓存信息内容的机制,通常情况下,本地采用两种信息存储方式:存储用户点击率最高的信息或根据对信息的分析选择近期是热点的信息。但这两种方式并非是最佳的选择策略。策略选择的好坏直接关系到提供业务的服务质量和对骨干网络带宽的压力。
3.2 组播技术
在内容分发方面存在两个瓶颈,一个是占用骨干网络传输带宽问题,另一个则是作为信息源的服务器的并发处理能力问题。目前存储器的存储容量不断提高,单位存储容量的价格下降很快,但相对而言,从存储器中存取信息的速度提高得不够快。因此,若为请求相同内容的用户同时发送一份信息将大大减轻服务器的存取压力。这种方式类似于广播电视所采用的方式,不同点在于广播电视采用无线方式传输,只要用户接收设备所采用的频率与发射机发射信号时所采用的频率相同,用户便可接收到发送的信息。在以有线传输为主的IP网络上,不可能向所有的地址均发送相同的信息,为此通常是选择一组地址来作为信息的接收者,也就是说,采用组播的方式来实现同时向一组用户同时发送信息的目的。
早期利用IP组播主要是在IP网络上的会议业务,其实现方式是在普通的IP网络上架构了MBONE网络,加入到MBONE的用户可采用组播的形式发送信息,同时可以接收采用组播形式发送来的信息。其工作原理是组成MBONE的路由器均具有组播功能,同时进行组播通信的端到端所经过的路由器均为组播路由器。当IP网络上的路由器均具有组播功能时,MBONE将成为IP网络的一部分而不再作为独立的网络存在。在利用路由器所具有的组播功能进行组播通信时,主要的技术难点在于:(1)用户如何找到进行组播发送的源;(2)组播源用何种方式建立组播树。
在提供组播业务时可采用两种实现方式。一种是利用组建IP网络的具有组播功能的路由器提供对一组用户的组播,信息源仅需将需要进行组播的信息发送给具有组播功能的路由器,组播路由器将为该信息所提供的组播组编号返回给信息源,信息源将该组播组编号向拟获得该信息的用户公布,用户通过加入相应的组播组编号加入到组播组从而接收到发送到组播组的组播信息。另一种实现方式是,信息源将信息发送到一个内容分发设备,并将欲发送到的用户的地址信息发送到该分发设备,由该分发设备将信息同时发送到列表中的所有用户,完成组播服务。
目前在IP网络上所提供的视讯直播节目是采用IP网络所具有的组播功能向用户提供的。为保护信息拥有者的数字版权,受控组播将是使用的主要方式。目前在一些国家正在进行在移动网络上提供流媒体业务的试验,为保持越区切换媒体流的连续性,在流媒体直播时,采用多地点组播方式来实现。
若组播组用户的数量较大同时用户的分布比较分散时,组播技术通常与CDN技术一起使用,利用CDN技术组建CDN网络,由初始信息源将信息组播到缓存信息节点,各缓存信息节点将接收到的信息再以组播的方式转发到用户,从而减少主干网络的拥塞和减轻信息服务器并发处理的压力。
3.3 端到端下载技术
上述两种内容分发技术实施的主体通常是网络运营商,内容分发技术的使用费用通常较高。考虑到目前用户所使用的计算机能力(存储能力和信息存取处理能力)较强,同时用户所拥有的巨大的存储空间通常处于闲置状态,若能将这些闲置的存储空间和处理能力利用起来,就可以在不增加用户使用费用的同时增加巨大的网络能力,同时用户也可以在将自己的计算机能力贡献出来的同时将自己的信息与其它人共享。为达到此目的,便出现了像BT一类的软件,利用该类软件可以实现用户和用户之间直接进行信息互换的对等通信。
采用端到端通信的方式进行内容分发有两种形式:纯端到端的对等方式和桥方式对等通信。
纯端到端的对等方式如图3所示。在该方式下,用户向周围用户询问是否有其所要的信息,根据所收到的应答消息,选择向存储有所需信息的用户中的一个请求发送信息。
图3 纯对等方式通信 图3中,用户Tn向周围的用户T1、T2、T3、T4和T5发送查找某种信息的请求,若先收到T1所发送来的信息,该用户便开始从T1处下载所要的信息。若在此之后用户Tn又接收到来自其它用户的应答信息,该用户将拒绝接收。
桥方式对等通信如图4所示,其工作方式是所有拥有信息的用户均登录到称为桥的服务器,该服务器将登录上来的用户所拥有的信息和用户所在的IP地址均发送给登录来的用户,供用户选择。