扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在如今以客户为中心的服务质量的竞争中,传统的基于单个IT元素的网络监控技术已经越来越力不从心,网络监控技术正面临着以“人性业务”为本的技术革命。
传统单点监控陷困境
在企业的运营管理人员经常有这样的烦恼:
每天都有问题从不同的子系统冒出来,网络又不通了?业务又停了?用户投诉!业务部门对计算机系统的投诉越来越多!技术人员焦头烂额,成了救火队员,还是不能让业务人员满意。客户满意度与自己的付出不成正比。郁闷!如果能有一个把业务监控起来的产品就好了。
交换机、路由器、防火墙、各个系统平台、数据库、Web服务器、各应用系统及这些系统设备运行环境……等等,每个环节都要有人维护,人员成本越来越高。负责数据库的不懂交换机,负责防火墙的不懂应用系统,负责中间件的又不懂路由器,每天所有的技术人员一个都不能少的待命。如果大家的知识能够共享,常见的问题大家都能解决就好了。
硬盘空间不够了、内存太小了、交换机端口堵了,是系统故障还是业务增加呢?更换设备又没有充分的依据,要是有一个历史的监控数据,用数字说话就好了。
出现以上问题,主要是因为目前采用的IT管理工具大都是从以传统的IT元素监控为出发点,基于各自独立的派系式模式,即使在同一网络的不同区域也是各自为政,甚至普遍存在着同一机房中同时使用多套分散监控工具的局面,更谈不上从企业业务的宏观角度去主动管理整体的IT架构。
油田网络管理故事
有一个现实的例子,某国内大型油田,有勘探部、钻探部、开发部、档案部等六个部门,计算机网络分为四个网段内,约600台计算机和服务器。其中,网络设备厂商有Cisco、3Com、Dlink;服务器操作系统有Windows2000、Windows2003、SUN Solars、Linux、SGI、AIX等。
该大型油田曾试用过几乎所有的免费、专业网络管理软件,但发现难以满足油田现有业务对IT环境可管理性的要求,还曾测试用过多家网络设备厂商提供的管理软件,但发现只能管理其自己公司的网络设备,并不能管理操作系统、系统应用。这些零散的工具都限于对单项资源或单项应用的分散监测,故障发生时,很难从分散的告警中分析出真实的故障根源;更无法提前发出预警,预防事故的发生,保障业务的运行。
图1:某油田企业的网络管理拓扑图
我们仔细分析一下这个大型油田企业,会发现,其网络的管理自动化程度低,维护人员疲于被动的应对多套管理工具,多种形式的告警,分离的故障和投诉。不仅大大降低了已有网络资源的利用效率和维护人员的工作效率,也造成IT管理严重脱节于企业业务的整体管理。随着网络规模的不断扩大,网络设备数量和各种应用软件系统的逐渐增多,软件和硬件设备出现问题的情况也越来越多,因此建设统一的IT管理平台就成了当务之急。
以业务为本,网络监控变被动为主动
近年来,用户业务部门不断推出基于网络应用的各种新式服务,系统维护的工作量急剧增加;同时,用户对应用的要求越来越高,网络必须具有高效的数据处理和反馈能力。
在这种形势下,需要网络管理系统对业务的监控和管理能力的提高,包括对系统、业务应用的拓扑展示、关键文件和进程的监控、实时的性能监控、故障告警、故障分析、定位和处理等能力的增强,从而提高企业的服务能力和服务质量,改善企业的市场竞争能力。
所以,需要建设一个满足“集中监控、集中维护、统一管理”现代化运营维护模式的、面向业务的、面向市场的运营维护体系,实现网络服务质量的全面提升,实现对业务子系统和应用软件的运行状况的全面监控以及日常运营维护管理,保障业务支撑网的正常运行。
基于以上需求,HP、中软融鑫等企业开始尝试性地推出以业务为本的新型网络监控平台。例如中软融鑫的IT系统智能监管平台,就从以“人性业务”为本的基础出发,进行了一系列革命性的创新:
集中监管:突破了对IT元素划分层次的传统管理理念, 构建了以人员及工作流程管理、信息系统运行监控、物理环境状态监测为基础的体系架构,将完整的IT架构管理集成在一个整体管理平台中, 为用户提供更高质量的服务,对IT系统从不同业务应用、不同层次、不同设备组件进行监测和管理。
集中式跨平台的IT运维监测管理平台,可以对网络、服务器、操作系统、中间件、数据库、应用系统及IT系统基础运行环境(UPS、空调、安防、监控等)进行管理,以为用户提供最终服务为视点,进行一站式的智能管理。
图2:智能监控系统技术架构
基于业务流程的智能监控:与业务系统进行紧密地结合,实现基于业务流程的、独有的系统运行信息监控模块,将以前多个IT元素的管理工具如系统监控、物理环境监测等整合到统一管理平台,采用统一的管理入口策略。
突破传统IT网管概念,将IT系统所有相关资源作为一个整体进行统一管理,高效的集成了传统的网络管理、系统管理、应用管理、IT系统运行环境管理、业务监控等功能。
IT系统智能监管平台通过引入综合报表、SLA规则和业务视图定义,将不同类型的监测器获得的数据进行多角度的综合分析,汇总出企业关心的IT整体运行状况,众多监测器监测到的各种管理信息将被汇总,映射为对服务和业务造成的影响和潜在风险。(技术架构见下图)
未来发展方向
传统的网络管理系统难以确认和处理。另外,系统中可能存在多个网管工具,对不同的系统维护需要到不同的管理平台上进行处理,而且大多数网管工具只能对硬件平台(网络、主机等)和系统软件(数据库、中间件等)进行初步监控,不能对各业务子系统运行状况、处理流程进行有效的监控,监控手段不够专业,监控范围不够全面,监控时效不够迅速,监控效率比较低下,使系统隐患可能长期存在,可能影响业务的正常进行,并造成巨大经济损失,因此需要引进先进的IT管理方法和手段,提高整体运维水平。
以业务为主的新型智能监管系统,以业务流程贯穿整个运维管理过程,变被动为主动,减少运维人员的劳动强度,提高效率,保障各业务支撑系统可靠、稳定地运行,进一步提高用户的满意度和忠诚度,全面提升企业的服务质量。专业IT系统综合管理产品出现,以IT服务最终目标为主导,必将成为监控的主流。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。