1月25日,华为在上海召开华为云 5G Cloud VR服务发布会,暨5G Cloud VR开发者沙龙。此项服务涵盖Cloud VR开发套件、华为云Cloud VR连接服务和Cloud VR开发者社区,解决Cloud VR基础设施及广域网适配问题。
华为与合作伙伴、开发者现场合影留念
要实现重度计算机渲染(CG)场景下的VR业务普适,首先就是要解决可获得性问题。在5G Cloud VR场景中,虚拟图像的生成从本地迁移到云端,使得终端变得更加简单,使用成本更低,这将促进VR走向千行万业。
此次发布的华为云5G Cloud VR服务包括3个模块:
一)Cloud VR开发套件,用于线下开发,开发者可先基于本地局域网络进行内容开发。
二)华为云Cloud VR连接服务,与运营商网络进行云端适配,并最终实现商用。华为云Cloud VR连接服务既可以直接为行业用户提供商用服务,也可以被开发者二次开发和集成。
三)Cloud VR开发者社区,用于交流互动和经验分享。
随着移动产业的不断发展,人们对体验需求不断提高,5G超大带宽、超低时延的特性以及可保障的网络等都是实现云+新兴业务的基础。通过智终端、宽管道、云应用的5G典型业务模式,Cloud VR将成为5G元年最重要的eMBB业务之一。
华为无线网络首席营销官周跃峰发表演讲
“5G和云是Cloud VR普及的双引擎,华为云增加了Cloud VR连接服务后,配合华为云遍布各地的计算资源,成为Cloud VR业务培养的沃土。任何传统的VR开发者、运营者、以及新进入者,都可以基于这个黑土地,轻松拓展自身业务。”华为无线网络首席营销官周跃峰在发布会上表示,“在5G来临前夜,该服务可以培育出众多的Cloud VR应用,并因为上云的低成本及使用的低门槛,让VR无处不在。本次发布的华为云5G Cloud VR连接服务将是业界第一个5G eMBB百兆级价值业务。”
华为X Labs下属MBB实验室主任赵其勇在与开发者现场交流中提到:“我们基于业界先进的开源组件和API,研发了Cloud VR连接协议和软件,且针对华为云平台进行了核心代码重构和优化,并支持面向5G的广域IP传输网络及多类型VR头盔。我们把该协议和软件转化为华为云的一种服务,提供给广大开发者使用。通过5G和云,充分发挥云的算力和头盔的便携性,带来了一种全新的业务模式和边界突破。”
此外,华为AR/VR产品线副总裁赵学知、华为云文娱解决方案专家周钮冬也出席了活动,表示基于5G和云构筑的Cloud VR模式将有效推动产业迅速发展,更好地协同端管云。两位分别就终端、云业务支持上解答了VR开发者的许多问题,为产业生态构建指引方向扫清阴霾。
华为提供了一项Cloud VR开发者扶持计划,符合条件的开发者可获得华为云资源充值券,重点扶持教育、旅游、建筑、会展、娱乐等行业的VR应用上云,支持产业生态发展。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。