10月29日,以“洞见当下,预见未来——5G+AI+视频,加速千行百业智能化升级”为主题的华为智能安防产业峰会在深圳召开。华为智能安防,面向5G+AI时代重新定义平台技术架构,将SDC(软件定义摄像机)升级为HoloSens SDC,将IVS(智能视频云)升级为HoloSens IVS,以新生态、新平台加速5G+AI时代千行百业的智能化升级。
同时,华为重磅推出首个基于智能视觉与感知的智能视频算法商城Huawei HoloSens Store,重新定义智能安防新生态模式。
5G+AI+视频 加速千行百业智能化升级
华为认为,未来二三十年,人类一定会进入万物感知、万物互联和万物智能的智能社会。万物感知是入口,万物互联是基础,而万物智能是结果。5G、AI和视频三种技术正在相互促进、相互激发,加速智世界的到来:视频+AI,当前49% AI行业应用以视频为基础,视频加速了AI在行业的落地;AI+5G,5G提供的大带宽和低时延让AI的算力无所不及;5G+视频,加速超高清视频(4K/8K)普及,催生了更多行业智能化场景。
华为常务董事 汪涛
智能视频、5G和AI是实现万物感知、万物互联和万物智能的核心技术。2018年,华为发布了人工智能战略,全栈全场景AI解决方案成为万物智能的核心;2018年,5G终端、网络和应用均步入成熟,端到端5G成为万物互联的核心。万物感知是入口,随着产业的发展,智能终端(面向2C侧)和智能视频(面向2B侧)正成为万物感知的核心。——华为常务董事汪涛
5G+AI时代 华为智能安防平台全面升级
“5G+AI+视频”已经成为当前时代发展的驱动力和加速器,5G改变社会,AI帮助企业提升运营效率,视频成为智能化基础的业务。同时,5G+AI时代的到来也为智能安防带来了数据实时、场景敏捷、商业灵活、隐私保护等新挑战,面对千行百业在智能化升级中更协同、更智能、更开放、更安全等新需求,华为智能安防平台全面升级。
华为智能安防产品线总裁段爱国介绍华为智能安防平台升级
SDC理念升级HoloSens SDC:华为发布《智能安防软件定义摄像机HoloSens SDC技术白皮书》,从“专业AI芯升级、开放的操作系统升级、丰富的生态体系升级”三大维度,推动软件定义摄像机从SDC向HoloSens SDC升级,助力千行百业构建全息感知的智能入口。
IVS理念升级HoloSens IVS:作为多维数据的汇聚与智能分析平台,华为从新生态、新架构、新内核全新定义HoloSens IVS创新平台,从“线下服务”升级到“线下+线上”全生态体系,从“边云协同”升级到基于vPaaS2.0的“端边云”全协同,从传统的“存算检”升级到基于华为“鲲鹏+昇腾”处理器的智能存算检模式。
智能视频算法商城 HuaweiHoloSens Stor全新上线
华为常务董事汪涛、华为智能安防产品线总裁段爱国携手首批入驻伙伴,正式发布首个基于智能视觉与感知的智能视频算法商城Huawei HoloSens Store,以华为产品为核心底座承载智能算法,提供迅捷开发、便捷下单、敏捷运营的全流程服务,提供多种入驻模式和商业模式组合,让合作伙伴和用户能够“随意挑”、“快速换”、“放心用”,加速千行百业实现智能化升级。
华为智能视频算法商城入驻仪式
HoloSens Store,让使用者从‘想法’到‘算法’不再遥不可及;让开发者从‘算法’到‘应用’不再是空中楼阁。华为智能安防将持续战略投入,与合作伙伴一起不断成长,使能行业,共建百花齐放的智能安防繁荣生态。——华为智能安防产品线总裁段爱国
丰富生态体系 共创安防新业态
会上,上海前端科技有限公司董事长肖永来、深圳市铁越电气有限公司董事长黄忆谭分享了基于华为智能安防产品的行业落地实践,两家合作伙伴将继续与华为智能安防深入合作,借助华为智能视频生态平台HoloSens Store,共同推进产业智能化升级。
2019年,华为智能安防业务连续三个季度爆发式增长,生态体系也快速成型。华为中国企业智能安防解决方案销售部总经理彭晓东表示:“2020年,我们将不断地把更新的理念和产品技术带向千行百业,携手伙伴,持续不断地为客户创造价值,共创安防新业态。”
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。