扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
VoIP是指通过IP网络传输电话呼叫的一种方式。VoIP允许通过已有的IP数据网络传输电话呼叫,从而帮助企业降低通信成本。同时VoIP技术在企业市场的应用使数据通信产品厂商进入了语音市场,激烈的竞争催生了很多新的应用。在诸多新的应用中,IP电话与企业数据以及桌面应用的集成已成为一个热点,企业级IP电话的语音质量对于整个融合解决方案的质量至关重要。
影响语音质量的因素
VoIP是以一种新技术的角色进入市场,与传统的PSTN网络进行竞争。作为替代技术,其语音质量应该能够与PSTN的语音质量一致或者更好。但是因为IP网络原本不是为传递语音数据而设计的,相对传统电话系统,一些技术难点需要克服,设计者必须面对由此而带来的挑战。常见的问题有网络时延、抖动、丢包和声学回声。
1. 网络时延
在传统的PSTN网络,洲际长话或者卫星长话的回路时延大约在500~600ms,这时候,当一方说话后要过一段时间对方才会听到说话并反应,双方通话脱节。在ITU的标准中建议电话系统的回路延时应该不大于300ms。在IP电话系统中,回路的时延包括语音报文打包时长、语音编解码所引入的延时以及处理网络抖动所引入的延时等。系统设计者必须均衡考虑各方面因素,使系统的回路时延尽可能小,使通话自然流畅。
2. 抖动
IP报文在网络上传递时,每个报文传输的路由都有可能不一样,在每个节点上传递转发的时间也可能不一样。在一个VoIP通话中,每个语音数据报文在网络中的传输时间都不一样。一些报文会比预计到达的时间晚到或者早到接收方,而在回放解码IP语音报文时,解码器以固定间隔回放语音数据。晚到的语音包会导致在一段时间内解码器没有数据可解,而早到的数据报文有可能被丢弃。所以系统中需要引入报文缓存区以去除网络抖动,平滑网络抖动所造成的影响。但是引入过深的缓存区,会使回路时延相应增大,需要选择合适的缓存区大小,在能去除网络抖动的同时,不过多增大回路延时。
3. 丢包
理想的网络情况是所有发送的语音报文都能够被接收端正常接收。但是IP报文在网络上传递时,网络的个别处理节点可能会出现处理能力不够或者带宽受限制的情况,部分报文可能会被丢掉。虽然IP网络上有一些机制可以在报文丢失的时候重传丢失报文,但是对实时性要求很高的话音数据并不能使用这些机制。
部分语音编解码方式有内置的丢包补偿算法,在丢包比率不高的时候,可以使用插值的方法做补偿,让接听方感觉不到语音信息丢失。但是在丢包率较高的网络,必须采用其它方法来控制网络丢包对语音质量的影响。
4. 声学回声
在电话二四线转换系统中通常存在两种回声:线路回声和声学回声。
线路回声是由于二四线转换的时候阻抗不匹配引起。在这种情况下,通话者的声音传递到远端的二四线转换时反射,同对方的说话送回到通话者的耳中。如果回路延时比较小(<50ms),通话者很难察觉到回声的存在,但是当回路时延比较大的时候,通话者就能听到自己的说话。IP通话的回路时延一般比较大,所以在有二四现转换的节点必须有回声抑制单元。
声学回声是由于在电话侧的播放和接听之间存在声学耦合,喇叭播放出的声音经过在空间中的一次或者多次反射以后回馈到听筒或麦克风而引起(如图1所示)。
在企业级IP电话的设计中,因为IP电话中没有二四线转换,所以线路回声的影响不需要考虑。声学回声的影响,特别是免提模式下的声学回声是系统设计者需要考虑的难点和主要问题。
市场上推广的很多解决方案宣称能够做到全双工免提。但是事实上,大部分算法都只能支持半双工免提通话。当全双工电话工作在免提模式下,通话的双方即使同时说话也能听到对方的声音。如果是只能支持半双工免提通话,当双方同时说话的时候,一方的声音被压制消除,不能被另一方听到。甚至在本地的背景噪声比较大的时候,对方的说话声音被压制,而听不到任何声音。
网络时延、抖动、丢包以及声学回声都是影响IP电话通话质量的重要因素,系统设计者必须妥善解决这些问题。芯片供应商如果能够提够成熟的方案解决这些共性问题,可以使系统设计者集中精力设计差异化的新业务,并缩短产品推向市场的时间。
IP电话解决方案
TI提供全面的VoIP解决方案,覆盖IP电话、家庭网关、电信级网关以及VoADSL和VoCable。针对企业级IP电话需求,TI提供了多种解决方案,其中TNETV1050/TNEV1055的SoC方案基于TI的TMS320C55x DSP系列的可编程DSP和增强的32位MIPS内核。它使用先进的系统架构,在提供高性能低功耗的同时,兼顾系统的可扩展性,还包括丰富的外设接口,满足设计企业级电话系统的要求。 [Page]
图2:TNETV1050/1055 IP电话处理器。
TNETV1050芯片包含一个内置的以太网交换机以及双PHY,可以在桌面上提供IP电话服务的同时,提供一个PC连接。TNETV1050的USB接口可以使IP电话连接多种USB设备,如PDA等。设计者还可以通过TI的VLYNQ接口扩展多种其他功能,例如Wi-Fi模块,硬件加密等。芯片集成了LCD控制器、CODEC以及键盘接口,降低了系统成本。
TI的IP电话软件套件包括了DSP核心算法和配套的CPU软件包。完整的DSP软件包括多种编解码算法、VAD、声学回声消除算法、报文回放模块,以及完全的统计调试信息功能和语音质量监控模块。针对企业电话应用,TI提供完整的声学回声消除模块支持全双工免提功能,同时支持本地三方会议功能以及宽带编解码算法。
CPU软件工具包,包括TI的CPU软件以及第三方的软件模块。其中包括控制DSP的API模块、支持呼叫控制的模块、加密框架模块、协议栈接口,以及第三方的协议栈模块。
TI的软件和第三方的软件一起提供了IP电话所需要的完整软件解决方案,优化的芯片解决方案和DSP/CPU软件大大减少了系统设计时间。针对企业级IP电话设计中遇到的共性问题,TI的软件提供系统的解决方法。
1. 抖动和时延的处理
针对抖动和时延问题,TI的DSP软件做了相应优化,采用紧凑的系统结构,消除不必要的算法延迟。同时采用自适应的去抖动缓存区的算法,可以计算网络的实时抖动,并根据实时抖动大小来调整缓存区的深度。在网络状况良好的时候,如企业的本地局域网中,去抖动缓存区算法可以缩小缓存区深度,以减小回路延时。
2. 丢报的处理
TI的软件包中包括主动和被动两种丢包处理办法。主动算法是在传输报文中加入冗余信息(RFC 2198)或者前向纠错信息(RFC 2733)。这样在回放端如果发现有报文丢失,就可以根据相应的信息恢复出丢失的报文。当丢失的报文无法用主动方法恢复的时候,可以用被动的方法去做补偿,根据前面的语音信息,拟合出一段语音用来补偿。
从图3可以看到,在网络丢包比较高的时候,使用主动干预仍然可以获得比较好的语音质量。
3. 声学回声的处理
解决IP电话的声学回声问题需要从两方面着手。
首先,设计者需要采用有良好声学特性的模具结构,以减小声学回声的幅度以及非线性回声的部分。设计者可以通过咨询相关的设计公司得到帮助。TI的方案包中包含声学设计指南,对声学设计中的一些要点提出建议。设计中的要点包括:尽可能增大喇叭到麦克风的距离;麦克风和喇叭在模具中应该有声学隔离;麦克风应用比较软的海绵包住,然后固定到话机上,以减少从模具上传递过来的震动;话机在接触桌面的部分使用减震的垫脚,以减少震动;选择频谱特性良好的喇叭和麦克风等。
其次,声学回声处理模块应能够良好地去除压制声学回声,并能够正确处理两端讲话(double-talk)和不损害背景噪声连续性。TI的声学回声抑制模块利用快速傅立叶变换,使用基于频域算法,能够快速收敛预测参数,有效的检测两端讲话。采用多级双向非线性算法,同时在非线性算法工作的时候利用频谱特征补偿背景噪声。
实时语音监控方案——PIQUA
VoIP的一大难点是IP网络的不确定性,而VoIP系统的语音质量很大程度上倚赖于网络质量的好坏。网络管理员需要一种实时监控VoIP的质量,主动干预网络配置和VoIP的设置。
PIQUA是TI推出的实时语音监控方案,它根据复杂的算法估算出用户对VoIP系统语音质量的主观感觉并实时上报,同时还提供重要的网络统计信息。上层软件和网络管理员可以根据实时语音质量以及统计信息对系统配置进行干预。例如,当某一段时间网络的丢报率比较大,导致语音质量下降的时候,系统管理软件可以根据PIQUA的信息,配置不同等级的冗余或者前向纠错来保证语音质量。同时网络管理员也可以根据PIQUA的记录,了解整个网络的状况,找到丢包率较高的原因,调整路由表或者网络带宽分配,主动维护整个语音网络的质量。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者