视频图像信号的空间冗余度和时间冗余度很大,为消除这种冗余,降低视频应用门槛,提升用户的感知体验,人类展开不懈的研究和探索。而由于编解码算法复杂,为保证编码图像的通用性,相关国际组织基于最新的视频编解码研究成果制订了图像编码系列标准,主要有ITU-T(国际电联)的H系列图像标准(H.261/263/264/265)和运动图像专家组MPEG系列标准(MPEG1/2/4)。进入21世纪以后,由于互联网的崛起、三网融合趋势加强等原因,两大组织的标准技术逐步融合。
追本溯源,正是视频编解码标准,推动视频监控走向数字化、网络化,并将推动视频监控业务走向高清、超高清时代。通过了解视频编解码技术的革新发展历程,我们完全可以洞悉视频监控的发展脉络。在视频非压缩时代,一个低分辨率的视频图像都需要上百兆的带宽,以数字化介质存储和网络化传输根本不现实的,那个时代视频监控只能以模拟形式存在。随着MPEG-1/MPEG-2/MPEG-4标准的推出,视频大小获得数十倍的压缩,使得视频采用数字介质记录成为可能,但由于视频传输仍占用过大带宽,网络化传输尚不现实。近年来,随着H.264标准的推出,视频获得上百倍的压缩,这使得视频内容以网络化传输成为可能,同时随着对更高图像品质的诉求,要求视频图像达到720P/1080P分辨率,H.264编解码技术推动高清网络监控时代到来。人类对视频图像品质的追求是永无止境的,2012年8月,H.265视频编解码标准草案正式获得ITU组织的批准,吹响超高清时代的号角,以更低的技术成本,获得更高的压缩比率(压缩率较H.264提升30~50%)和更好的图像质量(高达7680X4320分辨率的图像),随着H.265产业链的日益成熟,视频监控过渡到超高清时代指日可待。
新一代视频编解码技术应用展望
在IP网络摄像机中,被摄物经过镜头进入到摄像机中,通过sensor把光转化为可处理的电信号,再通过ISP功能模块对图像进行处理校验,最后由编码功能模块进行视频压缩处理,输出视频压缩码流。
经过压缩的码流通过网络进行传输,需要上墙播放时,先通过解码器进行解码,再在电视墙上实现图像显示。
由此可以看出,视频码流在视频监控中起着至关重要的作用,决定着视频监控系统的品质、成本和效率等等。当前视频监控领域主流的编解码标准是H.264和MPEG-4,并围绕这这些编码标准构建起成熟的产业链环境。
性价比越高的技术越有生命力。毋庸讳言,H.264是当下性价比最高的编解码技术,有权威机构统计,80%的视频芯片支持H.264标准。视频监控在进入网络时代之后,特别是在当前中国平安城市大联网的背景之下,H.264的局限性也不断凸显。
第一,客户不希望高码流,带来过高的建设成本。随着高清在数码领域的普及,视频监控客户也希望享受高清的图像品质,而通用1080P的视频图像,往往占用6~10M的带宽,这给网络建设和系统建设带来了成本的压力。像华为基于自己视频压缩技术的积累,根据不同的拍摄场景,采用更高效的压缩算法,采用同等画质的情况下,可以比业界低30%的码流,这种技术对大型项目的建设是非常之有意义的。
第二,客户已不满足于高清,希望以超高清带来业务决策高精确。随着视频监控应用的普及化,特别像交通和平安城市等领域,传统1080P的图像质量已经满足不了客户的需求,客户希望以超清的图像获得业务更精确的管理,而同时要求带来成本提升是可接受的。
客户的需求一直是技术进步的动力,面对视频应用不断向高清晰度、高帧率、高压缩率方向发展的趋势, HEVC(H.265)协议标准应运而生。这里我们展望下H.265给视频监控领域带来的价值。
第一,更高压缩比,降低端到端建设成本。根据业界网络视频监控的建设模型,存储和网络设备占据建设投资35~40%,已成为视频监控建设的重中之重,如何最大效率利用传输带宽和存储空间。根本上解决需要从视频压缩码流入手,采用H.265技术的视频压缩能力比H.264提升30~50%,根据测算可能带来的投资节省高达20%,甚是可观。
第二,更高清晰度,更精准的业务判断。在数码消费领域,1080P视频已经成为主流;视频监控领域1080P正在普及之中,但也有些客户提出了4K x 2K、8K x 4K的数字视频的需求。采用超高清的图像,可以获得更大视野范围,更加清晰的图像,为业务决策提供更精准的依据。另外一方面,智能分析发展受制的一个原因是图像不够清晰,导致分析的误判,采用更高的图像质量更容易获得更准确的分析结果。
H.265标准是在H.264标准的基础上发展起来的,可以预见H.265协议在未来广大的发展前景。和H.264/AVC相比,在同等PSNR下可节省约40%的码率,在同等的主观质量下,比H.264/AVC平均节省50%的码率,对720P及以上的高清序列码率节省尤为显著。
华为在H.265领域的积淀
华为作为全球领先的信息与通信解决方案供应商,拥有国内目前最大的视频研发机构,从1993年开始就开始视频领域的研究。同时,华为作为ITU-T的成员单位以及MPEG中国代表团成员(HEVC由ITU-T及MPEG两个标准组织联合指定),华为是ITU-T视讯标准的主要报告人和编辑者。此外,华为从2006年开始面向新一代视频编码技术(HEVC)进行技术研究,推动HEVC标准制定,并在在HEVC中拥有多项专利技术,成为H.265视频编码领域的技术引领者。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。