云计算、大数据、物联网、人工智能等信息技术飞速发展及传统产业数字化的转型,一方面媒体数据量呈现几何级增长,据IDC预测,全球数据总量预计2020年达到44ZB;另一方面,媒体的生产、传播和消费形式升级。巨量数据中,70%将会以图片和视频的形式存储和传播。这些数据从生产、传播到用户消费,传统方式运营成本居高不下。人工智能在视觉领域发展趋于成熟,基于AI人工智能的视频内容分析能从根本上解决传统内容分析方法性能低下的问题。AI助力,视频分析将全面进入智能时代。
视频从生产到消费全流程智能化
视频从生产到消费的全流程升级。
1.生产
视频采集,从专业设备到移动终端,视频内容采集大众化。华为云EI在采集阶段可提供美颜、滤镜、个性化等特效处理技术,助力视频采集即处理。
人脸交换效果图
内容审核,用户采集内容上传存储前,华为云EI提供视频内容智能审核能力,包括视频质量评估、黄/暴/恐鉴别、重复/相似鉴别及版权指纹分析等,避免低质量、重复/疑似不安全内容进入传播流程。
2.编辑
(1)结构化分析,针对各种类型的长、短视频,提供智能结构化分析,将视频以镜头、内容片段等结构化形式进行描述,便于后续的内容分析、存储和分发。
(2)内容分析,从场景识别、主体识别、行为/事件检测、语音/文本分析及内容描述等方面对其进行智能化分析,支持多维度内容查询和检索。
(3)智能编辑,基于智能内容分析,初步提供以下智能视频编辑技术:
a)视频拆条
相较于长视频,短视频更有利于在互联网传播,对传统媒体的节目进行拆条是不可或缺的。华为云EI基于人物、场景、语音、OCR字幕等多模态信息分析技术,快速精确地把长视频分割成不同主题的片段。面向海量多媒体视频,大幅提高视频识别、剪辑、检索等处理的效率,降低人工运营的成本。新闻类视频拆条准确率超过95%,特定场景准确率超过98%。
b)视频摘要
静态摘要,基于视频镜头变换、内容理解技术,华为云针对不同类型的长、短视频提供视频静态摘要服务,能够将1个小时视频压缩成5分钟的摘要内容,用于运营管理人员的内容快速浏览及用户快速内容播放。
视频浓缩,使用背景建模、主体检测、运动轨迹跟踪、前/背景融合技术,华为云EI提供视频浓缩服务,将极长视频中的事件提取出来,集中浓缩到较短的视频片段,便于视频内容中事件的快速观看。
c)视频封面
基于视频镜头变换、内容理解/分析和图像美学分析技术,快速提取内容相关、构图优美的关键帧作为封面,吸引用户进一步观看。相比于人工选取封面,智能封面选取速度提高20+倍,大幅降低运营成本。精彩封面能够吸引用户注意的同时,大幅提高视频点击率。
d)视频内容标签
视频识别,从多维度对视频内容进行提取,将非结构化的视频文件,转换为结构化的数据,为视频搜索,视频推荐,视频运营等提供了必不可少的信息。
e)水印处理
用户上传的内容除了新采集的视频,还有很大一部分为已有视频的重新传播。为了保护原始版权,新添加的内容需要打上水印,而重复传播的这部分视频有可能被重复打上水印,原始视频水印可能在中间传播过程中被去除。为了更好地保护内容版权,华为云EI提供水印检测和反去除技术,能够智能检测当前水印,重建水印,同时提供反批量去除水印技术。
3.分发,基于前述的视频结构化和智能分析,视频内容可按照多维度进行存储,结合用户行为日志分析,支持快速检索和关联推荐,将内容以最快的速度推送到最相关的用户。
4.消费,在用户消费视频的过程中,华为云EI提供自动评论及交互播放技术方案,提升终端用户体验。
目前,华为云EI在视频分析领域全面展开深入研究和新技术开发,已经与视频服务商华为视频、在线视频、短视频娱乐、泛娱乐直播等互联网及广电行业深入合作,共同为客户提供一站式智能视频分析解决方案和技术,提升客户视频全生命流程处理能力,为客户减少运营成本,助力客户快速、全面进入视频智能时代。
好文章,需要你的鼓励
三星与AI搜索引擎Perplexity合作,将其应用引入智能电视。2025年三星电视用户可立即使用,2024和2023年款设备将通过系统更新获得支持。用户可通过打字或语音提问,Perplexity还为用户提供12个月免费Pro订阅。尽管面临版权争议,这一合作仍引发关注。
浙江大学团队提出动态专家搜索方法,让AI能根据不同问题灵活调整内部专家配置。该方法在数学、编程等任务上显著提升推理准确率,且不增加计算成本。研究发现不同类型问题偏爱不同专家配置,为AI推理优化开辟新路径。
苹果M5 MacBook Pro评测显示这是一次相对较小的升级。最大变化是M5芯片,CPU性能比M4提升约9%,多核性能比M4 MacBook Air快19%,GPU性能提升37%。功耗可能有所增加但电池续航保持24小时。评测者认为该产品不适合M4用户升级,但对使用older型号用户仍是强有力选择。
清华大学研究团队提出SIRI方法,通过"压缩-扩张"交替训练策略,成功解决了大型推理模型"话多且准确率低"的问题。实验显示,该方法在数学竞赛题上将模型准确率提升43.2%的同时,输出长度减少46.9%,真正实现了效率与性能的双重优化,为AI模型训练提供了新思路。