在9月14日上海开幕的第十届GOPS全球运维大会上,华为云作为AIOps标准工作的成员单位出席了授牌仪式,并接受了颁奖。AIOps 标准由中国信息通信研究院旗下云计算开源产业联盟(OSCAR联盟)、高效运维社区和 DevOps时代社区联合发起,汇聚了国内一线互联网企业、通信、金融等行业顶级单位及专家联合编写而成,是国内外首个AIOps 标准。此标准已在中国通信标准化协会(CCSA)正式立项,并正申请成为国际标准。华为云专家从AIOps标协立项之初就参与了AIOps企业标准的制定工作和AIOps产品标准的制定工作。
华为是AIOps实践的先行者
华为很早就在实践AIOps了,从最早的On-Premise运维,到之后的IaaS运维和近几年的PaaS运维,以及现今的面向SRE的平台运维和面向客户的应用运维,涉及智能分析、应用分析、智能诊断与调优、自治运维、智能运维等。
华为云主要聚焦在公有云建设,围绕数据中心在统一运维架构、运维研发化的基础上,重点发展运维的标准化、自动化和智能化。同时直接面向云租户量身打造出应用性能管理APM、应用运维管理AOM等云运维服务,提供了具备初步智能运维能力的立体运维。华为云AOM/APM服务研究实现了基于强化机器学习算法的Auto-Scaling;基于时序数据行为模式(比如平稳型、周期型、规律型等)分析的智能告警;采用网络包的Hierarchical Clustering分析方法推导出服务间调用的因果路径,准确率基本达到了90~95%以上;还有把改进聚类算法和创新的移位环算法对调用链数据进行“好”“坏”智能分析,结合函数出入参、环境信息、资源占用等变量,给出可能导致异常的原因,并在Dashboard中的拓扑图、heat map和histogram等形式呈现给用户。上述实践只是华为云利用ML技术探索AIOps核心能力建设的一部分成果。
AIOps深耕细作、聚沙成塔
AIOps首先适合用于复杂的场景中,尤其是各种可能组合数量远远超越了人力所能企及的范围;这种场景下人工分析缺乏对大局的完整认识,但AI能力很强。还比如复合因素下的趋势预测(资源寿命、性能指标、容量)、故障预防、问题定界定位、根因分析等。
其次AI技术在一些时效性要求高的场景中得到应用,比如基于指标、日志、事件的告警。应用或者系统出现异常后,是需要第一时间通知到运维值守人员的。还比如云服务的弹性伸缩、智能阈值告警。
尽管业界在某些子领域或者单点技术上AIOps取得了显著进展,但运维域AIOps还有很大的发展空间,离真正做到无人值守、NoOps还有很长的路要走,比如可信故障自愈、RCA传导、端侧智能等都有待业界共同努力。华为云成为AIOps标准工作的成员单位意味着华为云以开放的心态积极拥抱AIOps和参与社区建设,也体现了客户和社区对华为在智能运维领域的多年耕耘及成果的高度认可。在运维域,华为云提出做AIOps技术的引领者、行业AIOps运维转型的赋能者,以及云时代AIOps的铺路人,这与AIOps标准工作组的宗旨完全契合的,希望产业社区联合起来,共同促进和推动IT运维领域的智能化,为客户数字化业务保驾护航。
好文章,需要你的鼓励
随着5G流量快速增长和新用例不断涌现,网络运营商需要在最小化环境影响的同时管理密集网络使用。Orange法国与爱立信合作开展创新试验,测试FDD大规模MIMO天线集成无线电,优化高流量区域频谱使用。双方还探索Cloud RAN和Open RAN架构,通过虚拟化RAN功能实现灵活的软件中心网络。合作重点关注利用AI驱动的自动化和意图驱动技术提升能源效率,在不影响性能的前提下动态调整网络资源以降低能耗。
谷歌DeepMind等顶级机构联合研究揭示,当前12种主流AI安全防护系统在面对专业自适应攻击时几乎全部失效,成功率超过90%。研究团队通过强化学习、搜索算法和人类红队攻击等多种方法,系统性地突破了包括提示工程、对抗训练、输入过滤和秘密检测在内的各类防护技术,暴露了AI安全评估的根本缺陷。
微软正在将Windows 11改造为"智能代理操作系统",在任务栏中集成AI代理功能。新功能允许AI代理在后台执行任务,用户可通过任务栏图标查看进度状态。微软还在文件资源管理器中集成Copilot,提供文档摘要、文件问答等功能。此外,Click to Do功能得到改进,可将网页表格转换为Excel文档。这些AI功能采用本地AI和云端AI混合模式,为用户提供更智能的操作体验。
西蒙弗雷泽大学和Adobe研究院联合开发的MultiCOIN技术,能够将两张静态图片转换为高质量的过渡视频。该技术支持轨迹、深度、文本和区域四种控制方式,可单独或组合使用。采用双分支架构和分阶段训练策略,在运动控制精度上比现有技术提升53%以上,为视频制作提供了前所未有的灵活性和精确度。