智能终端行业的光速发展无疑是一个工业奇迹。十年前,智能手机横空出世;而十年后,全球智能手机出货量则已经接近15亿台。2017年中国市场共计售出了4.9亿台智能手机。在智能手机普及率已接近70%的背景下,这意味着中国用户在去年至少淘汰了3.4亿台智能手机。这些手机大部分功能完好,可以正常使用,而淘汰他们的原因仅仅是因为有了更快、更好的产品。
通常情况下,这些被淘汰的手机只能静静的躺在抽屉里,等待数年后被丢进垃圾堆的命运。对于一台功能完好的电子设备来说,这显然是一种巨大的浪费。而面对这一现状,南京云恩通讯科技有限公司为这些已经闲置的电子产品找到了另一条物尽其用的出路。
让淘汰手机物尽其用
南京云恩通讯科技有限公司所推出的掌上看家应用可以充分利用闲置手机、电脑以及智能电视中的网络及摄像头功能,让这些闲置设备成为家庭安全监控中的摄像头和检测仪。
通过一个掌上看家APP,用户可以让闲置智能终端设备与云平台相连,让用户出门在外也可实时监控家中情况。同时,通过云端人工智能程序,掌上看家还可基于视频画面实现动作侦测功能;即使用户没有观看实时画面,云平台也可通过APP对用户发出警示。
此外,掌上看家APP还支持1080P高清视频规格、视频检索、回看、双向语音、远程控制,定时录制等功能,从而使APP具备更多的场景适应能力。
可以说南京云恩不仅通过APP和云平台构建了一个高可靠的家庭安全监控系统,更让闲置的智能终端找到了新的用武之地,大幅降低了用户在家庭安全监控上的成本。
另一方面,南京云恩还基于软件核心算法及视频流传输协议搭建了众云视频平台,将自身的核心技术打包成为SDK并对外提供API接口。目前这套SDK已被众多行业合作伙伴应用在可视门铃、网络摄像机、行车记录仪、航拍无人机、智能家居、智能机器人、移动执法等不同领域。这些应用与合作也让南京云恩的核心技术在更高的层次实现了物尽其用。
用户迅速增加,
急需更加坚实的云平台支撑
由于找对了市场,产品切中用户所需,云恩用户规模迅速扩大,掌上看家APP用户至2018年3月已达2800万,100多家合作企业的300万台已集成了云恩SDK的智能设备,正在使用云恩提供的音视频传输、数据存储服务。面对用户数量的急剧增长和频繁发生的服务器运算资源带宽资源的突发性需求,以及越来越多的AI人工智能服务的需求,南京云恩最终选择了全面与华为云进行合作。
大平台托起大应用
作为一个公有云平台,华为云有足够的体量来为用户提供海量的计算、存储以及网络资源。对于高清视频监控、录制这样的高计算量、高存储、高网络需求应用来说,只有华为云这样的大平台才有能力支撑其广泛应用。而华为云目前主推的C3云主机更是业界云主机性能领域中领先级的存在,能够在同样、甚至更低的价格下提供顶级的计算性能,让视频编解码任务可以更快完成,降低延迟,实现更好的用户体验。
另一方面,华为云还将AI技术融入PaaS层并推出了EI智能体服务。基于这项服务,用户可以轻松调用经过优化的各类AI框架,以更低的成本和更高的效率开发AI程序,降低AI门槛、缩短开发与应用之间的距离,从根本上提升效率。
“对此,南京云恩通讯科技有限公司总经理谢钢表示:以云恩目前的业务体量,每一次突发事件都会造成用户的巨量增长,将服务器主要部署在IDC机房存在应对迟缓,抗风险能力低等问题,与华为云合作不仅具有一般云所具有的服务器带宽资源扩展灵活方便等优势,更重要的是华为云上不碰数据下不碰运用,又有专业服务团队提供支持。另一方面,华为云在AI相关的SDK方面也有非常丰富的积累,我们的人形检测、人脸识别功能就是基于华为云所提供的服务来实现的,而且实现效果出众,对视频的分析量非常小。因此,对于南京云恩来说,华为云是最理想的合作伙伴。”
作为国内公有云市场的新贵,华为云在提供基础IaaS服务的同时更重视为用户赋能,将大数据、AI、边缘计算、物联网等能力以服务的形式提供给用户,帮助用户实现产品及业务上的创新升级。
而在业务飞速成长的同时,华为云更始终秉持“三不”承诺,不做应用、不碰数据、不做股权投资,为广大客户和伙伴提供一个单纯、好用、先进、放心的云平台,与客户和伙伴共享成功。这也正是华为云作为中国云计算市场中流砥柱所具备的一份担当。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。