西城区位于北京市中心城区西部,是首都功能核心区之一。除了通常的行政职能之外,北京市西城区政府在全面应对特大自然灾害、处置公共安全事件、保护人民群众生命财产安全过程中,及时启动应急预案,快速应对公共突发事件的处置,同时承担有关应对突发事件的宣传、教育和培训工作。
项目需求
为贯彻落实北京市政府办公厅和北京市应急办对高清电视电话会议系统的建设要求和标准,西城区区委区政府于2015年围绕区政府、26个区属相关委办局、15个街道办事处等重要单位,展开了首批全区单位高清电视电话会议系统的升级改造工作(高清会议系统改造一期)。项目建成后,实现了西城区以区应急指挥通信会议室为核心主会场,将高清电视电话会议系统从区主会场延伸至区属各级职能部门和街道办事处内,并初步形成市、区、街(和区属委办局)三级高清电视电话会议联网的应用机制。
根据业务需求,西城区区委领导在结合《北京市公车改革方案》和《北京市人民政府电视电话会议管理规定》等相关规定下提出,在西城区高清会议系统改造一期项目的基础之上,进一步加强全区高清电视电话会议系统建设的指导意见。本次项目意在实现对西城区未部署高清电视电话会议系统的区属分会场进行高清会议终端的配备工作,同时本次项目还将丰富完善西城区电视电话会议手段,实现小规模桌面式(或移动式)电视电话会议模式,为业务量大、会务需求多的部门及个人提供高效的会议服务。
华为作为业界领先的高清视讯解决方案供应商,针对西城区政府的上述需求,提供了全高清高端视频会议解决方案,包括高端RP200多功能智真、espace 8950可视话机、高端桌面智真DP300,网络穿越服务器、移动软终端,结合之前的建设内容,形成了以下全面的解决方案。
方案特点
本次项目将完全依托于西城区现有高清电视电话会议系统的基础之上,本着统一领导、统一规划、统一标准、统一建设的原则,对现阶段西城区高清会议系统存在的问题进行补充和完善。整体方案安全稳定、简单易用、场景丰富,满足不同的业务需求。
安全稳定
平台MCU VP9660采用实时嵌入式操作系统,支持板卡、电源、网口、芯片等多重备份。其中成熟的板卡备份技术,当会议使用的媒体板出现故障时,实现毫秒级将业务倒换到空闲媒体版,切换过程与会人员无感知,大大提高了整个系统稳定性,从而保障会议的顺利召开。移动软终端通过网络穿越服务器连接到视频会议网络,减少防火墙的端口开放,保障整个网络和视频会议系统的安全。
场景丰富
除了常规的视频会议室开会场景之外,MAX沉浸式影院级智真满足应急指挥的会商需求;桌面智真DP300可以让领导便捷地在办公室召开和加入视频会议;8950可视话机作为小型个人会场,方便用户进行小范围的临时会商,安全,保密;当用户在外出差或者巡视时,也能通过软终端加入视频会商,充分满足客户各种业务场景的视频会议需求。
简单易用
会议终端具备主叫呼集、语音呼叫、会议列表一键入会等功能,紧急情况下无需协调运维人员就能自主召开视频会议,方便快捷。MAX会场丰富的大屏显示模式,提供更全的会议信息,帮助领导高效决策。RP多功能智真采用一体化设计,美观、简洁、大方,带来1080P高清真人面对面视频会议体验。DP300桌面智真提供触屏操作,会控简单,平时还可作为电脑显示器,减少空间占用。整个视频会议系统便捷易用。
客户价值
华为视频会议解决方案助力西城区政府高效沟通,系统高可靠支持7*24小时稳定运行,充分保障客户随时召开视频会议。系统高临场感的互动体验,协助应急办实现横纵联动、高效协同应对突发事件,平战结合,同时用于召开日常行政会议、培训计划的实施和小范围会商,大大减少会议沟通成本,提高政府部门工作效率。
华为从1993年开始视频会议相关产品研发,目前已经成为全球领先的视频会议解决方案供应商,华为视频会议产品和解决方案已经在超过60个国家和地区规模应用。根据2016年IDC权威数据统计,华为视频会议解决方案在中国区市场份额名列第一,目前已经广泛应用于政府及公共事业、金融、互联网、电力等行业客户,尤其是我国政府行业,70%以上的政府骨干网络视频会议选择华为。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。