5G将开启产业互联网变革的新篇章,推动5G融合应用发展是业内共识。GTI最新发布的《5G智能化网络白皮书》强调,网络智能化是5G网络高效高质建设部署和运营不可或缺的能力。如何为用户提供更高质量、更有保障的通信服务,成为运营商乃至整个社会信息化发展的重要课题。
5G核心网运维的新挑战
5G核心网(5G Core)是电信运营商5G建设的重要组成部分,采用全新技术,在实现网络部署、网络功能、新业务开展的同时,监控保障也面临全新挑战。在4G核心网(EPC,Evolved Packet Core)中,网元由专有设备承载,硬件属性较强。而在5G核心网环境中采用基于服务架构(SBA,Service Based Architecture),融入云原生、微服务等设计思想, 以软件化,模块化、服务化的方式构建核心网。对于全新核心网的运维保障,面临如下挑战:
网络功能解耦使监控对象数量激增
依据3GPP定义,5G核心网的各网络功能(NF,Network Function)在功能级别上解耦,拆分出若干个独立的网络功能服务(NFS,Network Function Service),这些网络功能独立运行,提供标准化服务接口,通过相互调用访问实现网络功能。在5G核心网方案中,虚拟化、云原生技术的融入,使通用服务器取代专有硬件设备,与此同时虚拟网元,虚拟机、容器POD的数量飞速增长,每个工作负载同时提供多个IPv4、IPv6工作平面。
相较4G EPC,由于众多方面演进叠加在一起,在5G核心网SBA架构中虚拟化后的NFS实例数量以2个以上的数量级增长,需要监控的对象数量巨大是5G核心网保障侧第一个挑战。
服务自动化增加了网络追踪的难度
通过网络功能仓储(NRF,NF Repository Function),5G 核心网的各类网络功能服务得以自动化管理,实现服务的自动发现以及注册、更新、状态检测等,避免服务访问中进行大量手动配置工作;集中控制面可以将大量跨区域的信令交互变成数据中心内部流量,优化信令处理时延;根据业务应用的变化,按需快速扩缩网络功能和服务,提高网络的业务响应速度。自动化管理在生产侧提升了管理效率,同时在核心网保障侧增加了动态性强、难以跟踪的新挑战。
路径优化与交互解耦抬高了监控复杂度
4G核心网的网元之间的通信遵循请求者和响应者的点对点模式,是一种相互耦合的传统模式。在 5G 核心网服务化架构下,各网络功能服务之间可以根据需求按需通信。5G 核心网架构下的网络功能服务间通信机制进一步解耦为生产者和消费者模式,具备灵活可编排、解耦、开放等优点,是 5G 时代迅速满足垂直行业需求的一个重要基础能力。各网络功能在实际应用过程中,避免了不必要的网络中转,但服务间的调用依赖,访问追踪,性能分析,故障定位等也成为运维保障侧的新挑战。
DeepFlow 5G核心网网络功能服务监控方案实践
DeepFlow是一款面向5G核心网,基于对服务NFS间的通信访问流量进行获取分析,以保障核心网稳定运行的软件产品。在整体方案中,可按处理逻辑分为流量获取、数据分发传输、诊断分析三大部分,通过流量采集预处理抽象层,提供流量采集及预处理的北向管理接口,使整个监控平台具备可扩展的基础数据获取能力。
通常5G核心网环境中,主要涉及到KVM虚拟机与容器POD的网络流量获取。DeepFlow 5G核心网网络功能服务监控方案支持IPv4、IPv6协议环境,紧密结合HTTP v2协议,实现服务间关联依赖监控。本文基于运营商实际5GC运行环境,化繁为简并以Free5GC环境为基础进行介绍。
What is free5GC?
The free5GC is an open-source project for 5th generation (5G) mobile core networks. The ultimate goal of this project is to implement the 5G core network (5GC) defined in 3GPP Release 15 (R15) and beyond. -- www.free5gc.org
Free5GC是5G核心网开源软件项目,总体架构基于3GPP标准、遵循SBA框架,采用虚拟化方式实现网络功能,可运行5G核心网的标准服务,并且可以模拟相应工作流程。在实际5G环境中,多数厂商已经采用容器技术承载网络功能服务。在本文环节中,采用虚拟机运行容器,创建Kubernetes集群, 搭建5G核心网验证环境,使能各网络功能。通过云杉网络的DeepFlow平台实现对各网络服务的监控保障。实践过程中部署的组件包括控制器、采集器以及数据节点。
图:5G核心网监控方案
由大到小追踪网络服务
在5G核心网的监控实践中,由大到小,逐级有序地展示服务运行状态及关联关系。通常根据工作流程分为三大范围,较大范围以数据中心所属区域或资源池划分,其次为网络功能或服务类型,比如AMF、UDM、SMF等,最后将集中在IT单元,比如容器POD、宿主机、IP等。DeepFlow平台按照三类范围由大到小的操作划分,为核心网所涉及到的复杂网络提供完整的、逐级的监控跟踪。下图呈现的是各类型网络功能服务运行及调用关系全景视图,将服务接口(SBI,service-based interface)中的网络各功能间的调用通信,以及性能指标进行自动绘制并呈现。
图:功能服务全景图
实践过程中,关注服务间重点指标,包括网络层(吞吐、载荷),传输层(并发连接、TCP建连时延、TCP系统时延,TCP重传、建连失败)应用层(HTTP请求、HTTP时延、HTTP异常),绘制访问调用关系全景视图后,在知识图谱功能支持下,可以迅速关联列举相应的知识维度。
分钟级定位异常边界范围
5G核心网中存在大量的、复杂的NFS间服务调用,具备有效的调用性能跟踪能力尤为重要。
图:服务间访问示例
如上图所示,一个简单的逻辑调用,AMF(Access and Mobility Management Function)中的NFS调用UDM(Unified Data Management)中的NFS获取用户信息,这个过程中,并不是像传统环境中直观简单。在5G现网环境中,普遍涉及宿主机、虚拟机、容器的网络虚拟化实现,以全栈分段来梳理访问调用,是应对新环境运维排障挑战所必须具备的。以全栈视角,展开以上调用,可以剖析NFS发起调用所经过的POD接口、虚拟机接口、宿主机接口乃至网关等链路。
图:服务调用全栈跟踪示意图
全栈跟踪针对云中服务间的调用访问,将虚拟化所实现的逻辑通信进行逐步展开,清晰便捷展示每段的网络状态,性能,结合知识图谱及丰富的指标数据,快速定位性能异常的问题范围边界。以上所述访问为例,如果排查调用延时故障,确定NFS调用服务双端后,展开全栈跟踪,直接定位延时所在的接口。如全栈跟踪示例图中,清晰展示出服务AMF服务实例至UDM服务实例两端访问延时瓶颈在UDM功能侧,且聚焦在其运行所属虚拟机的虚拟网络接口处。而排除UDM服务实例的POD网络接口及AMF所涵盖的虚拟机、POD等众多接口路径。
图:全栈跟踪示例
在没有DeepFlow全栈跟踪工具的情况下,排查服务访问调用的性能将是一个头绪纷乱、复杂繁琐且冗长的过程,同时对于一线运维人员要求所掌握的技术栈相对较多、要求综合能力强,很可能耽误宝贵的运维窗口时间。
总结
以上Free5GC示例运行在实验室环境,模拟运行了相应的测试用例,实际生产场景较实验室更加环境复杂且规模巨大,势必对运维保障提出更高要求。经过实际环境测试验证,DeepFlow平台也确实能为5G核心网填补监控保障空白。
DeepFlow是一款面向5G核心网,应对网络功能服务(NFS)分拆解耦后的新挑战,进行流量采集获取、分发、可视化与监控保障的产品。帮助5G核心网在基于服务架构中统一采集服务间的网络流量,实现对访问调用的全面性能监控,并提供容器化后的全栈路径跟踪,补齐5G核心网服务监控空白,应对云原生特点,紧密结合5G服务,解决5G核心网生产中遇到的监控、运维、保障等难题。
好文章,需要你的鼓励
瑞典央行与金融机构及国家安全部门深化合作,共同应对网络威胁。今年5月,瑞典遭遇大规模分布式拒绝服务攻击,政府和金融机构受到严重冲击。总理克里斯特松承诺增加资金支持,建立更强大的公私合作伙伴关系。央行将举办第二届在线网络安全挑战峰会,鼓励金融机构提升网络安全能力。瑞典金融协会敦促建立危机管理机制,与国家网络安全中心等机构协调配合。
字节跳动发布Seedream 4.0多模态图像生成系统,实现超10倍速度提升,1.4秒可生成2K高清图片。该系统采用创新的扩散变换器架构,统一支持文字生成图像、图像编辑和多图合成功能,在两大国际竞技场排行榜均获第一名,支持4K分辨率输出,已集成至豆包、剪映等平台,为内容创作带来革命性突破。
工作压力源于大脑储存混乱而非系统。本文介绍5个ChatGPT提示词,帮你将工作压力转化为结构化行动:优先级排序任务清单、快速撰写专业邮件回复、从冗长文档中提取关键信息、生成问题解决方案、高效准备会议内容。通过系统化处理工作事务,将分散的精力转为专注执行,让大脑专注于决策而非重复劳动。
红帽公司研究团队提出危险感知系统卡(HASC)框架,为AI系统建立类似"体检报告"的透明度文档,记录安全风险、防护措施和问题修复历史。同时引入ASH识别码系统,为AI安全问题建立统一标识。该框架支持自动生成和持续更新,与ISO/IEC 42001标准兼容,旨在平衡透明度与商业竞争,建立更可信的AI生态系统,推动行业协作和标准化。