扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:Bill Pechey 2006年10月17日
关键字: 语音识别 网络应用 Windows Vista
IT行业有时候看起来就好像是都市的公交车:可能很多年都没有变,但是突然有一阵子出现了大量的改变。这次我要说的是语音识别技术。Nuance公布它最新版的语音识别软件Dragon Naturally Speaking 9,而微软也在经历过一次惨痛的失败后,在SpeechTEK大会上重新推出了他令人印象深刻的语音技术产品。
我曾经用过这两个语音识别软件的前一个版本,客观的说,如果使用高质量的麦克风,它们都可以具有良好的表现。虽然我还没有用过Dragon 9,但是据用过的人说,它比以前的版本有了很大的进步。除了精确度有所提高外,它也是第一个具有独立于扬声器模式的语音识别软件。如果这一功能真的有效,那么将为语音识别技术打开一个广阔的应用空间。
在这里我必须说明,我一直认为对着电脑说话是应该被避免的,至少应该是在私人空间里进行的行为。不过微软看上去好像并不认同,从他在Windows Vista中加入语音识别技术就可以看出。而且我认为当Windows Vista大面积发行后,微软将更加公开的推动语音识别技术。我只是希望这不会导致像在公车上大声讲电话这种不文明行为的泛滥。
目前各界对于语音识别技术的研究热情令我有些惊讶。很多大型企业都有这方面的专业研究团队,各大院校的有关研究也很多。如果不是要对着电脑说话,如此大规模的研究又是为了什么?也许答案是网络应用。
欧洲电信标准协会(Etsi)有一个叫做Aurora的项目,即开发一套在移动网络上的分布式语音识别应用标准。标准规定,部分语音识别引擎工作在移动终端设备上,并将语音传输给识别中心。我对这种应用的接受程度比前面所说的要大,毕竟对着手机说话要比对着笔记本说话容易被人接受。
Etsi表示,语音识别的其中一项应用是用户在路上对着电话讲述会议内容,然后将这些内容同过邮件发送给自己,以便在回到办公室或回到住所,在对会议内容进行进一步编辑。这听上去挺不错的,用户不会再去考虑其它一些网络服务商所提供的类似收费服务了。
正如目前流行的SpinVox服务所展示的,用户在收到语音信箱的留言后,不是听到录音,而是看到留言的文字内容。一个中央语音识别系统可以让企业网络也具有类似的功能,尤其是当与扬声器无关的语音识别技术出现后。由于微软的Office Communications Server 2007内置了语音识别技术,因此也许这会是企业的一个不错的选择。
比尔盖茨说,语音识别技术将成为未来十年的一个主流技术,这一点我也认可,但是这种主流在网络应用中的规模也许比在独立PC应用上的规模更大。不论如何,企业现在也应该开始考虑一下,语音识别技术到底是不是会对自己的系统效率有提高作用。
(责任编辑:陈毅东)
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。