近期,华为云与国际领先深度学习加速方案提供者深鉴科技共同发布语音识别加速引擎DDESE——DeePhi Descartes Efficient Speech Recognition Engine,即深鉴科技笛卡尔架构高效语音识别引擎。该方案以语音识别为应用载体,对AI类应用推理计算进行全面加速。成为目前国内公有云市场上,首款基于FPGA平台的原创深度学习语音识别加速解决方案,现已全面登录华为云市场。
近年来,云端业务发展日新月异,市场对底层硬件架构提出更高性能的要求,而FPGA的可定制化和多功能的灵活特性,与云端灵活、复杂、多变的需求“不谋而合”,继而在全球云端业务中广泛加快布局。而华为云顺应趋势,并结合自身硬件优势全面推出FPGA加速云服务器平台,应用场景覆盖基因分析、视频/图片处理、深度学习、加解密、大数据等多个领域,致力于为企业提供极致、易用、专业的FPGA加速云服务。
华为云结合深鉴科技,在FPGA加速云服务器平台上发布了DDESE。该产品是以Xilinx FPGA为计算架构平台,为用户打造的一款算法、软件和硬件协同设计的推理计算加速解决方案。基于深鉴科技独有的深度压缩能力,可以在保持精度的同时将神经网络压缩超过10倍,并部署在深鉴科技自主研发的笛卡尔架构硬件平台上,其核心加速引擎能够显著降低语音识别的延时,同时达到更低的功耗。根据单句语音识别重复测试的结果,DDESE端到端语音识别的计算速度是同等级GPU(Tesla P4 + cudnn)的2倍,其中LSTM部的加速比超过2.5倍。该款产品主要应用于语音识别场景,可为用户提供端到端语音识别服务。
目前,在国内公有云市场上,深度学习解决方案与FPGA硬件架构的相关产品都非常少。而DDESE是立足于FPGA平台的深度学习语音识别加速解决方案,跨越两个新领域,或是目前为止首款“FPGA+深度学习”的解决方案。深鉴科技坚持以算法软硬件协同优化的理念,领先推动FPGA的新浪潮。华为云提供开放的生态,为深鉴科技提供发布解决方案的平台,降低FPGA开发与部署的技术门槛,让更多开发者和行业伙伴享受FPGA硬件解决方案带来的加速能力。
未来,深鉴科技希望依托于华为云的平台,能够在FPGA领域继续突破前沿技术,引领国际先进的深度学习加速方案,进一步赋能语音识别应用场景。目前,DDESE正面向华为云用户提供免费试用,期待更多开发者与厂商体验深鉴算法、软件、硬件协同设计的深度学习加速解决方案。
点击体验DDESE:https://app.huaweicloud.com/product/00301-110982-0--0
好文章,需要你的鼓励
生成式AI的兴起推动全球数据中心需求激增,微软和亚马逊等科技巨头2025年资本支出预计达1550亿美元。然而电力供应成为关键瓶颈,运营商正寻求新的建设地点。中东北非地区凭借现代化电网、地理位置优势和充足资本成为热门选择。阿联酋和沙特在数字化转型中领先,该地区在电力、连接性和监管环境方面具备优势,有望成为全球数据基础设施中心。
哈尔滨工业大学团队开发的Optimus-3是首个在Minecraft环境中具备完整认知能力的AI系统,能够同时处理感知、规划、行动、定位和反思五大任务。该系统采用专家混合架构和任务级路由机制,有效解决了多任务学习中的干扰问题,并通过多模态推理增强强化学习显著提升了视觉相关任务的表现。实验结果显示,Optimus-3在各项任务上均超越了现有最先进系统,为通用人工智能的发展提供了重要技术路径。
NTT Data亚太区CEO约翰·隆巴德指出,许多生成式AI概念验证项目因基础设施不足和缺乏完善治理而无法规模化部署。研究显示90%的企业正在审查现有基础设施,包括网络、存储和安全系统,这些都需要现代化改造才能支持大规模AI应用。企业对话正从生成式AI转向智能体AI,后者能自主执行复杂任务。
香港科技大学团队提出PosterCraft统一框架,通过四阶段训练流程实现高质量美学海报端到端生成。该方法摒弃传统模块化设计,采用整体性创作思路,在文字准确性和视觉美感方面显著超越现有开源模型,接近商业系统水平,为AI创意设计领域带来重要突破。