VoIP技术的基本原理与应用

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

　通过因特网进行语音通信是一个非常复杂的系统工程，其应用面很广，因此涉及的技术也特别多，其中最根本的技术是VoIP (Voice over Internet Protocol，因特网语音)技术，可以说因特网语音通信是VoIP技术的一个最典型的、也是最有前景的应用领域。

来源：比特网 2010年1月17日

关键字： IP通信 VoIP 统一通信

　　1、引言

　　传统的电话网是以电路交换方式传输语音，所要求的传输带宽为64kbit/s。而VoIP技术则是以IP分组交换网络为传输平台，对模拟的语音信号进行压缩、打包等一系列的特殊处理，使之可以采用无连接的UDP协议(用户数据报协议)进行传输。由于VoIP采用了先进的数字信号处理技术，可以将64kbit/s的语音信号压缩成8kbit/s或更低码速率的数据流，能够在同一条线路上传输比传统电话网更多的呼叫，大大提高了效率。同时，VoIP采用了分组交换技术，可以实现信道的统计复用，使得网络资源的利用率更好，大大降低了运营商的投入成本。所以VoIP的最大优势就是价廉，通过因特网打长途电话的成本仅相当于传统电话的1/5，最多不到1/2，其发展前景看好得到共识，未来的商机促使越来越多的研究机构、国际标准化组织、产品制造公司对此项技术的研究。

　　2、VoIP的基本传输过程

　　为了在一个IP网络上传输语音信号，VoIP模型的基本结构由两个或多个具有VoIP功能的设备组成，而且这些设备通过一个IP网络进行连接。

　　从图1中可以发现VoIP设备是如何把语音信号转换为IP数据流，并把这些数据流转发到IP目的地，IP目的地又把它们转换到语音信号。通信各方的网络必须支持IP传输，而且可以是IP路由器和网络链路的任意组合。因此可以简单地将VoIP的基本传输过程分为下列几个阶段。

　　2.1、模拟语音到数字语音的转换

　　语音信号是模拟波形，通过IP方式来传输语音，不管是实时应用业务还是非实时应用业务，首先要对语音信号进行模数转换，也就是对模拟语音信号进行8位或16位的量化，然后送入到缓冲存储区中，缓冲器的大小可以根据延迟和编码的要求选择。许多低速率的语音编码器是采取以帧为单位进行编码，典型的帧长为10ms-30ms，这是由语音信号的短时平稳性决定的。考虑到传输过程中的代价，语音包通常由60ms、120ms或240ms的语音数据组成。数字化可以使用各种语音编码方案来实现，目前主要采用ITU-T(国际电信联盟-电信标准部)G.711语音编码标准。发送方的语音编码器和接收方的语音解码器必须实现相同的算法，这样接收方的语音设备才可以还原模拟语音信号。

　　2.2、数字语音到IP包的转换

　　一旦语音信号进行了数字编码，下一步就是对语音包以特定的帧长进行压缩编码。大部分的语音编码器都有特定的帧长，若一个编码器使用15ms的帧长，则把从第一级来的60ms的包分成4帧，并按顺序进行压缩编码。每一帧包含有120个语音样点(抽样率为8kHz)。经过压缩编码后，将4个压缩的帧合成一个压缩语音包送入网络处理器。网络处理器为压缩语音包添加包头、时标和其它信息后形成IP包(一个分组)。

　　2.3、IP包的传输

　　IP包通过网络传输到另一端点，语音网络简单地建立通信端点之间的物理连接(一条线路)，并在端点之间传输编码的信号。IP网络不像电路交换网络，它不形成连接，它要求把数据放在可变长的数据报或分组中，然后给每个数据报附带寻址和控制信息，并通过网络发送，一站一站地转发到目的地。在这个通道中，全部网络被看成一个整体，持续不断地从输入端接收IP包，然后在一定时间(t)内将其传送到网络输出端。t可以在某个范围内变化，反映了网络传输中的抖动。网络中的中间节点检查每个IP包附带的寻址信息，并使用这个信息把该IP包转发到目的地路径上的下一站。网络链路可以是支持IP数据流的任何拓结构或访问方法。

　　2.4、IP包到数字语音的转换

　　目的地VoIP设备接收这个IP包并开始处理。网络级提供一个可变长度的缓冲器，用来调节网络产生的抖动。该缓冲器可容纳许多IP包，用户可以选择缓冲器的大小。小的缓冲器产生延迟较小，但不能调节大的抖动。首先，网络处理器去掉寻址和控制信息，保留原始的压缩语音包，然后把这个压缩语音包提供给解码器。其次，解码器将压缩语音包解压缩后产生数字语音，这个模块也是按帧进行操作，完全和编码器的长度相同。若帧长度为15ms，则60ms的压缩语音包被分成4帧，然后它们被解码还原成60ms的数字语音送入解码缓冲器。

　　2.5、数字语音到模拟语音的转换

　　播放驱动器将缓冲器中的语音样点(4帧共480个样点)取出送入声卡，通过扬声器按预定的频率(例如8kHz)播出。

　　简而言之，语音信号在IP网络上的传输要经过从模拟信号到数字信号的转换、数字语音封装成IP包(分组)、IP包通过网络的传输、IP包的解包和数字语音还原到模拟信号等过程。

　　3、VoIP的关键技术

　　IP分组网络采用的是尽力而为的、无连接的技术，因此没有服务质量保证，存在分组丢失、失序到达和时延抖动等情况。通常的数据业务对此要求不高，但VoIP业务对时序、时延等有严格的要求。因此必须采取特殊措施来保障一定的业务质量，这些特殊措施就是VoIP的关键技术，主要包括：信令技术、语音编码技术、实时传输技术、服务质量保障技术、静音检测和回声消除技术等。

　　3.1、信令技术

　　信令技术保证电话呼叫的顺利实现和话音质量，目前被广泛接受的VoIP控制信令体系包括ITU-T的H.323系列建议和IETF(互联网工程任务组)的会话初始化协议SIP(Session Initiation Protocol)。

　　H.323系列建议定义了在无业务质量保证的因特网或其它分组网络上多媒体通信的协议及其规程。H.323呼叫建立过程涉及到三种信令：RAS信令(R=注册：Registration、A=许可：Admission和S=状态：Status)，H.225.0呼叫信令和H.245控制信令。其中RAS信令用来完成终端与网守之间的登记注册、授权许可、带宽改变、状态和脱离解除等过程;H.225.0呼叫信令用来建立两个终端之间的连接，当系统中没有网守时，呼叫信令信道在呼叫涉及的两个终端之间打开;当系统中包括一个网守时，由网守决定在终端与网守之间或是在两个终端之间开辟呼叫信令信道;H.245控制信令用来传送终端到终端的控制消息，包括主从判别、能力交换、打开和关闭逻辑信道、模式参数请求、流控消息和通用命令与指令等。

　　SIP是一种应用层协议，可以用UDP(用户数据报协议)或TCP(传输控制协议)作为其传输协议。与H.323不同的是：SIP是一种基于文本的协议，这样易于实现和调试，更重要的是灵活性和扩展性好。由于SIP仅作于初始化呼叫，而不是传输媒体数据，因而造成的附加传输代价也不大。与H.323相比，SIP还有建立呼叫快、支持传送电话号码的特点。

　　3.2、语音编码技术

　　语音压缩编码技术是VoIP技术的一个重要组成部分。按照H.323协议，VoIP主要采用的语音压缩编码技术标准有ITU-T定义的G.723.1、G.729、G.729A等。其中G.723.1协议采用5.3/6.3kbit/s双速率语音编码，其语音质量好，是H.323协议中首推的编码标准，其缺点是延时较大。G.729协议可将经过采样的64kbit/s语音以几乎不失真的质量压缩至8kbit/s。由于在分组交换网络中，业务质量不能得到很好保证，因而需要语音编码具有一定的灵活性，即编码速率、编码尺度的可变可适应性。G.729原来是8kbit/s的语音编码标准，现在的工作范围可扩展至6.4kbit/s～11.8kbit/s，语音质量也在此范围内有一定的变化，但即使是6.4kbit/s，语音质量也还不错，因而很适合在VoIP系统中使用，其缺点是算法较复杂。而G.729A协议主要是在G.729协议的基础上减少了运算复杂度，可优先在在VoIP系统中使用。

　　3.3、实时传输技术

　　实时传输技术主要采用路由选择协议RTP(Routing Table Protocol)。RTP是在点对点通信和多点广播的包括语音在内的实时数据传送协议，它是一个独立于应用程序的协议规范。RTP协议由两个紧密相关原部分组成：RTP数据协议和RTP控制协议RTCP。RTP数据协议对包括语音在内的数据进行包封装以便实时传输，RTP控制协议提供了时间标签和控制不同数据流同步特性的机制，可以让接收端重组发送端的数据包，可以提供接收端到多点发送组的服务质量反馈。

　　3.4、服务质量保障技术

　　VoIP的服务质量QoS(Quality of Service)保障技术主要包括3个方面：一是采用注册许可机制来限制网络登录的用户数，以防止产生资源缺乏现象，导致语音质量进一步降低;二是采用交换优先机制，为语音数据优先预留资源，主要采用资源预留协议(RSVP)来保障语音质量;三是在VoIP应用软件中引进自适应策略，通过监测网络资源的变化并根据变化情况来做相应的技术调整，例如，可以通过监测网络带宽的变化来调整编码器的编码速率，当网络出现拥护时，采用低速率语音编码，反之，采用高速率语音编码，从而最大限度地保证语音质量。

　　3.5、静音检测和回声消除技术

　　静音检测和回声消除技术也是VoIP中十分关键的技术。静音检测技术可有效剔除静默信号，从而使语音信号的占用带宽进一步降低到3.5kbit/s左右，通常，静音检测技术根据连续几帧语音信号的能量与一定的门限电平进行比较来检测语音的存在与否;回声消除技术主要利用数字滤波器来消除对通话质量影响很大的回声干扰，保证通话质量，这点在时延相对较大的IP分组网络中尤为重要。回声消除技术的实现有两个关键问题：一是选择何种滤波器结构;二是确定调整滤波器系数的自适应算法，选择的原则是使某一特定的代价函数最小。

　　4、VoIP技术的应用

　　VoIP网关是公众电话网与IP网络的转换接口，它将庞大的电信网与因特网相连，因此可以利用VoIP技术实现各种增值业务。

　　4.1、VoIP长途电话业务

　　VoIP长途电话业务是通过因特网而和公用交换电话网(PSTN)的结合来实现电话到电话和传真到传真的呼叫。用户仍然使用他们普通的电话和传真机，呼叫通过PSTN接入，然后通过VoIP网关经因特网传输。

　　4.2、语音邮箱服务

　　用户利用VoIP系统将语音文件用电子邮件的方式发出，收件人可以利用多媒体计算机将语音邮件播放出来。另外还可以将语音邮箱和普通电话进行绑定，用户可以通过电话来收听自己的语音邮件，同时，用户可以预先在计算机上设定自己常用的一些电子邮件地址，以后就可以通过电话来完成语音邮件录制和发送。如果再通过专线将PC机和移动台相连，那么每当用户有新邮件到达时，就可以通过手机直接播放电子语音邮件，这极大方便了对计算机操作不熟悉的用户。

　　4.3、万维网(Web)电话业务

　　万维网(Web)电话是VoIP技术与万维网技术结合的产物，它可以使用户通过万维网的页面图标直接接通电话。当用户在因特网上浏览时，如果对某家公司主页上的内容感兴趣，只要点击一下屏幕上的图标，就能通过语音网关将IP地址转变为PSTN上的电话号码，与公司的电话接通，立即与该公司的代理人通话。

　　4.4、呼叫中心服务系统

　　新型的呼叫中心服务系统采用VoIP技术与网络及数据库相结合，一般的话务员就可以提供专家级的服务。当用户与话务员交流时不仅可获取其最感兴趣的信息，而且还可以通过IP网络及数据库查到或取出专业的语音信息(而不是要求随时有专家服务)。这种高质量的服务和较低的运营成本，在激烈的市场竞争中将会对公司有很大的帮助。

　　5、结束语

　　VoIP应用的日益增长是不可回避的事实和趋势，但是我们不能因此认为基于PSTN的传统通信方式就穷途末路了，由于技术成熟、用户习惯等优势，PSTN还会在很长的一段时间内存在，但是随着VoIP技术的成熟、费用的下降、功能更加强大，VoIP肯定会占据更多的应用市场份额。虽然我们认为VoIP是一种非常先进的技术，但是对于一个企业来说，VoIP的应用必须根据自身的情况来考虑其应用，对于分支机构不断扩展的现代企业，VoIP无疑是最佳的选择，但是对于传统企业我们必须考虑到其可行性和实用性，要考虑如何与传统方式达到最佳的结合，或者说如何最有效地运用VoIP技术，提高工作效率，为企业带来利益。

　　参考文献：

　　[1] 黄永峰. 因特网语音通信技术及其应用[M] 北京：人民邮电出版社 2002.1

　　[2] 张登银等. VoIP技术分析与系统设计[M] 北京：人民邮电出版社 2003.5

　　[3] 陈万培. 因特网语音通信的关键技术.电声技术[J]，2003.5：52-53

　　[4] Bill Douskalis. IP电话技术稳定的VOIP服务集成. 北京：机械工业出版社 2000.9

　　作者简介：王洪(1974-)，男，四川岳池人，95740部队工程师(信息工程大学硕士)，主要研究方向为语音信号处理。

　　通迅地址：昆明呈贡95740部队82分队　王洪

　　邮编：650500

　　E-mail: trueredsun@163.com