因为具有远远大于小型车的吨位,卡车常常被视为马路上的“霸王”,在城市的建筑工程中,卡车往往是负责运输建筑材料和建筑垃圾的主力军。
所谓的“渣土车”,是专门用于运送沙石等建筑材料的卡车,对渣土车的管理是一项与城市稳定发展,人民幸福生活密切相关的社会管理项目。然而在不少城市中,渣土车在帮助运输建筑材料的同时,也带来了一些安全隐患,比如屡屡发生撞人、污染城市环境、非法倾倒、影响居民生活等交通违法事件,让行人和其他车辆恐惶不已,成了舆论讨伐的对象。
在北京市海淀区,现有数千辆渣土车未登记备案,部分备案车辆未按规定进行运输作业的事件时有发生。海淀区城市服务管理指挥中心(以下简称中心)负责全区渣土车管理工作。以前中心对渣土车违规问题,只能通过人工方式查看视频,往往一个人需要花费5-8个小时才能查询到目标渣土车,不仅效率低下,而且不能做到部门间信息共享与及时联动处理。
为了提升管理水平与工作效率,海淀区启动了“网格化图像信息系统微卡口(大数据)平台”项目,对全区各街镇三级平台视频接入、管理和存储等设备进行升级,实现各街镇模拟标清、高清等多种信号集中控制,新建区级微卡口(大数据)分析平台,实现对车牌、车型、车辆特征等数据的智能检索分析,并支持未来按需部署人脸分析、WIFI探针等智能化业务应用。
华为联合业内优秀的视频大数据服务提供商熙菱信息,在完成与区指挥中心、城管委、执法局、住建委等部门充分调研和大量分析建模工作后,于2017年11月在华为云视频云平台成功上线“海淀区智能卡口平台”,为中心搭建了一套车辆大数据分析平台,帮助对全区车辆进行实时监管。系统上线运行2个多月以来,已经在超过4000万过车数据中(超过830路微卡口,含改造卡口)完成对2000多辆渣土车准确识别与管控,大幅提升了城市服务管理效率。
基于这套平台,中心可对前端高清卡口摄像机抓拍的图片采用智能算法进行识别,并对二次结构化分析结果归类统计,实现一车一档,对非法渣土车在高发街道、高发时间段、高发卡口等位置的监控与管理调度提供辅助决策支持,全天候车辆正确识别率超过95%,实现对海量数据快速比对碰撞与特征检索,10秒钟内就可完成对千亿级图片的识别与检索。
华为云视频云以“一云一池一平台”架构为客户做顶层设计,可根据业务发展需求提供弹性平滑扩展的计算与存储能力。
一云,即协同资源云,通过协同资源云满足视频分析类应用对于CPU与GPU(图像处理器)算力的需求,加速新算法、业务上线。
一池,即融合资源池,采用分布式文件存储技术构建融合资源池,用OceanStor 9000统一存储微卡口视频,整合人、车、物等多维数据,实现多类型数据一池共享,为大数据深度挖掘与关联分析提供支撑。
一平台,即智能服务平台,FusionInsight作为车辆大数据应用的智能服务平台核心组件,可基于多维数据,逐步实现以机为主、以人为辅的研判模型,全维度实时研判、专业研判、深度研判,实现重点目标管控由“靠人盯”向网络化实时查控机制转变。
鉴于华为云视频云与智能卡口平台的良好表现,海淀区政府决定2018年陆续接入全区各机构的近万路高清视频,包括执法大队、住建委、市政市容委、交通支队、学校、医院等,按需授权给各单位调用与管理,并逐步上线更多基于视频大数据的应用模块。同时,接入各部门可根据业务发展及突发应急保障业务需求,灵活调配视频图像的计算、存储与分析资源,对各自管理区域内的重点目标主动发现、主动预警,有效提升重点人、车、物和事件的管控能力,维护海淀区乃至全市的社会稳定。
除北京外,目前华为云视频云还服务于广东、江苏、江西、甘肃、青海、湖北等地公共安全行业客户。华为将持续发挥在公共安全领域方案顶层设计优势,以领先的行业解决方案与ICT产品技术,助力公共安全视频联网共享与平安城市建设。
好文章,需要你的鼓励
韩国科学技术院研究团队提出"分叉-合并解码"方法,无需额外训练即可改善音视频大语言模型的多模态理解能力。通过先独立处理音频和视频(分叉阶段),再融合结果(合并阶段),该方法有效缓解了模型过度依赖单一模态的问题,在AVQA、MUSIC-AVQA和AVHBench三个基准测试中均取得显著性能提升,特别是在需要平衡音视频理解的任务上表现突出。
这项研究利用大语言模型解决科学新颖性检测难题,南洋理工大学团队创新性地构建了闭合领域数据集并提出知识蒸馏框架,训练轻量级检索器捕捉想法层面相似性而非表面文本相似性。实验表明,该方法在市场营销和NLP领域显著优于现有技术,为加速科学创新提供了有力工具。
un?CLIP是一项创新研究,通过巧妙反转unCLIP生成模型来增强CLIP的视觉细节捕捉能力。中国科学院研究团队发现,虽然CLIP在全局图像理解方面表现出色,但在捕捉细节时存在不足。他们的方法利用unCLIP生成模型的视觉细节表示能力,同时保持与CLIP原始文本编码器的语义对齐。实验结果表明,un?CLIP在MMVP-VLM基准、开放词汇语义分割和视觉中心的多模态任务上显著优于原始CLIP和现有改进方法,为视觉-语言模型的发展提供了新思路。
这项研究介绍了RPEval,一个专为评估大语言模型角色扮演能力而设计的新基准。研究团队从法国里尔大学开发的这一工具专注于四个关键维度:情感理解、决策制定、道德对齐和角色一致性,通过单轮交互实现全自动评估。研究结果显示Gemini-1.5-Pro在总体表现上领先,而GPT-4o虽在决策方面表现出色,但在角色一致性上存在明显不足。这一基准为研究人员提供了一个可靠、可重复的方法来评估和改进大语言模型的角色扮演能力。