扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
谷歌音频索引(Gaudi)在Google Labs推出了一个正式的界面。早在今年7月份,谷歌便推出了这项应用于网络应用的语音识别技术。
GAudi 是Google Audio Indexing的缩写,它是Google Labs的最新成员,顾名思义,我们可以用搜索框来找出YouTube视频中的人所说的话。这一功能最早在曾应用在 iGoogle gadget 中,但Google正在计划将这种技术变成搜索服务的一部分。
网站有相关的使用说明事例,如“搜索政治家的讲话”,就会在YouTube视频播放器旁显示搜索结果,点击结果,播放器就会显示此讲话的一段视频。
另外,搜索的结果中还会包含一些相关的视频内容。
据透露,谷歌今年会把经营的重心转移到YouTube上,谷歌可以轻易决定视频的内容,并在视频旁配置广告,以获取收益。
谷歌一直致力于将视频混合到其搜索结果中,但语音与文本之间的转换还存在着很大的技术障碍。目前最好的办法就是通过检查伴随的元数据搜索视频中的内容,例如视频中的标题与说明。但这种搜索方法的搜索范围非常有限。
业内人士称,谷歌在语音识别技术方面有更大的雄心。借助其翻译工具,谷歌很可能将视频内容翻译成其它语言。这样便会极大的拓展其服务的范围。
同时,谷歌高层在FAQ网页上也表示,Google Labs上的谷歌音频索引项目应用范围将更广,为美国总统竞选服务只是谷歌走出的第一步。谷歌音频索引项目只是一个实验性的平台,通过这一平台运营,谷歌将会积累更多的经验。
就谷歌为什么会选择政治家作为其首个实验平台的问题,谷歌回应,政治家在大众中间的影响力非常大,容易受关注。另外,政治家的语言往往比普通人的语言更简洁,语音识别技术比较容易处理。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者