2018年9月5日,视频编码器测评领域享有盛誉的MSU(Moscow State University,莫斯科国立大学)视频编码器大赛成绩揭晓,华为自主研发的HW265软件编码器拔得头筹,在SSIM(视频信号结构相似度)及VMAF(多方法评估融合)评价指标均获得第一名的好成绩。首次参赛即获得双料冠军,充分彰显出华为云视频服务强大的技术实力以及在行业内的领导者地位。
视频编码器大赛(Video Codecs Comparison)由莫斯科国立大学主办,每年定期在全球范围内征集各大公司及相关机构的视频编码器,对适合不同的应用场景视频编码器进行综合测评,迄今已连续举办十三届,是视频编码行业内具有最高影响力的比赛。
历年以来,全球主要的编码器厂商均参加过该项测评赛事,这两年随着国内编码器厂商的实力崛起,国内参赛者逐年增多,尤其是以公有云为代表的厂商均把该项大赛当成了证明视频综合实力的首要战场。今年参加MSU测评大赛的视频编码器总计有19个,参赛厂商包括华为、腾讯、金山、谷歌、Intel、MulticoreWare、Vitec、Ucodec等,强者如云,竞争异常激烈。
HW265编码器由华为自主研发,基于H.265标准的视频编码软件,可以广泛应用视频直播、点播、4K、VR等业务场景,同时也能应用于传统的广电和IPTV市场,并能给用户带来极致的视频体验
此次世界编码器大赛采用SSIM作为唯一评价指标,来衡量参赛编码器在不同应用场景(快速场景、通用场景、极致压缩场景)下的能力水平,HW265在这三类场景下均获得第一,同时总成绩第一并优于第二名7%。
今年除了沿用传统的SSIM评价指标外,还进一步尝试引入了VMAF评价指标作为参考, HW265 同样获得了总成绩第一的好成绩。
编码技术是视频核心技术,直接影响用户的观看体验和带宽消耗。此次华为云视频服务在世界视频编码器大赛中斩获双料第一,将进一步助推对视频前沿技术的深入探索,持续引领产业发展。
目前,华为云视频服务为客户提供专业级转码、点播、直播等一站式解决方案,使能视频成为各行业基础能力,为客户打造极致体验。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。