两年前,一部名为《我在故宫修文物》的记录长片,将以往秘不示人的文物修复过程和技术,展现给世人。从那时起,文物背后的保护工程就变得不再神秘。随着时代的进步,人们不再满足于博物馆内昏黄的光线,沉静的文物以及冰冷的简短注释,对博物馆提出了更多的要求,因此,博物馆产业发展的背后,除了对原始资源的保护,革新工作也提上了日程。
近几年随处可见博物馆外开设了语音讲解租赁点,但听觉层面的满足感始终不及给人视觉上带来冲击。基于让人们超越以往距离欣赏文物的想法,西安的秦渲云与华为云展开合作,让汉代女俑翩翩起舞;千年的小金龙飞天下海。
众所周知,西安是中华文明和中华民族的发祥地,历代帝王盘踞,博物馆自是不在少数。2018年,秦汉新丝路数字博物馆解决方案在华为云的技术支持下诞生,其中的云渲染技术实现了毋需消耗本机CPU,不用U盘拷贝,只需要在用户在云端一键上传即可渲染,让文物“活泼”起来。
借助于云渲染技术,汉代女俑的舞蹈投射在展台上方。谁能想到以往博物馆见到的正襟危坐的汉代女俑,舞姿居然是如此曼妙,惊艳程度完全不亚于《甄嬛传》中嬛嬛的《惊鸿舞》,让人目不转睛。
另一亮点,同样是神乎其技。秦渲云的交互式3D技术、AR技术和VR技术的应用的运用弥补了以往文物“只可远观“的遗憾。在屏幕上,无论是将文物放大缩小,还是360度大翻转,手触即可操作。
这场博物馆革新,华为云功不可没。首先,华为云运用先进的对象存储OBS技术,使秦渲云在任务上传带宽利用率方面达提到95%以上,较之前传输速度提升300%,故而精良画质呈现在大众眼前。
另一方面,无论是面对复原汉代青铜行灯的细节还是重塑仰韶文化彩陶的颜色,大场景和众多馆藏文物的复原需要大量的计算资源支持,借助华为云自动化弹性部署使得秦渲云能够快速调度全国乃至全球的上万台云主机,最大程度降低了使用成本,提升CPU使用效率。让经典文化在现代科技手段下重现活力。
华为云携手秦渲云,领跑渲染行业进入公有云时代。借助华为云海量的云资源,秦渲云实现了在资源布局、渲染规模以及渲染效率全面提升。通过云计算和大数据支持,形成了面向全球的人工智能数字内容渲染场景解决方案。
除了在云渲染行业展开合作外,华为云在各行各业均多有建树。华为云旨在将物理世界与智能世界连接,并依托华为30年的技术积累以及在云领域的长线布局和投入,致力于让各行各业用上“用得起、用得好、用得放心”的“普惠AI”,以实现众多企业数字化转型,稳步上云。
据了解,2018华为全联接大会将于10月份在上海召开,届时将首发华为AI战略和全栈全场景的解决方案,并携合作伙伴带来更多诸如“秦渲云”这样AI、云、大数据、5G、IoT、视频等在各行业的创新与实践,“+智能,见未来”我们拭目以待。点击了解华为云:https://www.huaweicloud.com/
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。