“NVIDIA初创企业GPU应用大赛”第一季于今年五月正式启动,得到了众多企业的踊跃参与。北京飞搜科技在本次赛事中表现优异,荣获优秀案例奖。
高清图像在交通录像取证,竞技场景细节还原等环境下,为专业人士提供着至关重要的细节信息,但在实际应用中,由于制作工艺和成本的考虑,很多场合都不会采用高分辨率、超分辨率的相机来进行图像信号的采集,因此,将低分辨率的图片还原成高分辨率图片就非常重要。
图像超分辨率(Super Resolution, SR)就是将低分辨率(Low Resolution, LR)的图像通过一定的算法转提升到高分辨率(High Resolution, HR)的技术。以往传统的图像超分辨率技术在图像还原方面差强人意,而且需要大量人力进行比对,效率很低。GPU和深度学习的大规模应用为整个行业带来了突破性的发展。目前,使用GPU来加速图片超分辨率重建已经成为业界内逐渐成熟的技术方案。
作为NVIDIA初创加速计划成员,北京飞搜科技有限公司(http://www.faceall.cn/)在计算机视觉领域拥有多项世界领先的研究成果,尤其是在人脸识别、目标追踪、目标检测等领域。飞搜科技团队采用NVIDIA Tesla P100对图像进行大规模的深度学习训练,实现了对视频监控图像中对低质量图片快速重建,且重建出的高清图像的人眼感官效果颇佳,远超传统的超分辨率方法。
飞搜科技在超分辨率领域实力雄厚,表现卓越,早在2018年的计算机视觉顶级会议CVPR(Computer Vision and Pattern Recognition)workshop NTIRE(New Trends in Image Restoration and Enhancement)竞赛中就已斩获优异成绩,而本次优秀案例奖的获得更是对飞搜团队的实力的认可。飞搜科技在超分辨率技术上的解决方案能够在诸如交通、博彩等需要进行模糊图像重建的行业得到广泛应用,而在在NVIDIA Tesla P100系列GPU的大力支持下,可以预见,飞搜科技将有实力把应对超分辨率的各项解决方案完善到“效率更高、速度更快、识别更准”的至臻境界之上,为深度学习在超分辨率上的应用起到更大的推动作用。
好文章,需要你的鼓励
上海交通大学研究团队开发出革命性AI癌症诊断系统,通过深度学习技术分析50万张细胞图像,实现94.2%的诊断准确率,诊断时间从30分钟缩短至2分钟。该系统不仅能识别多种癌症类型,还具备解释性功能,已在多家医院试点应用。研究成果发表于《Nature Communications》,展示了AI在精准医疗领域的巨大潜力。
南华理工大学等机构提出3DFlowAction方法,让机器人通过预测物体3D运动轨迹来学习操作技能。该研究创建了包含11万个实例的ManiFlow-110k数据集,构建了能预测三维光流的世界模型,实现了跨机器人平台的技能迁移。在四个复杂操作任务上成功率达70%,无需特定硬件训练即可在不同机器人上部署,为通用机器人操作技术发展开辟新路径。
这是首个系统性探索跨视角协作智能的综合性研究,由南京大学、东京大学等顶尖机构联合完成。研究团队首次将"第一人称视角"与"第三人称视角"的协作应用进行了全面梳理,提出了三大技术方向和十三个关键任务,涵盖从智能厨房到手术机器人的八大应用场景。这项突破性工作为人工智能向人类认知迈进提供了重要的技术路径和理论基础。
这项由台湾大学与微软研究团队合作的研究探索了使用音频感知大语言模型(ALLMs)作为自动评判员来评估语音生成模型的说话风格。研究设计了"语音风格指令跟随"和"角色扮演"两个任务,测试了四种语音模型的表现,并比较了人类与AI评判的一致性。结果表明,特别是Gemini-2.5-pro模型,其评判结果与人类评判的一致性甚至超过了人类评判者之间的一致性,证明ALLMs可以作为可靠的自动评估工具。同时研究也发现,即使是最先进的语音模型在说话风格控制方面仍有显著改进空间。