随着企业规模的不断扩大,为了方便地管理
路由器、交换机、
服务器等设备,网络管理系统开始被越来越多地应用在企业之中。然而,当企业的规模更大时,特别是当企业部署完众多对实时性、连续性要求比较高的关键业务时,普通的网络管理系统却遭遇了应用尴尬。
压力:被动应战关键业务故障
当一个关键业务的运行出现故障时,到底是交换机端口堵了?防火墙受到了病毒攻击?还是数据库
服务器的服务协议出现了故障,还是关键业务服务器系统本身的问题?更进一步,这可能是关键业务本身的流程控制出了问题而导致了故障。
当这些问题出现时,我们会发现,尽管网络管理员、系统管理员总是在不停地盘查问题,但却总不能让关键业务良好地运行。当网络管理员、系统管理员们陷入了“四处救火”的尴尬境地时,传统的以设备为对象的网络管理已经力不从心了。
例如,在某银行单位的企业网络中,运行着多种应用,主要包括:生产业务系统、中间业务系统、办公自动化系统、网上银行系统等。由于这些系统需要实时地提供数据,所以对整个网络的连续性、可用性、实时性有非常高的要求。同时,该银行网络系统从小型机到PC 服务器,从微软Windows到IBM AIX
操作系统,从Oracle到Informix数据库,从Cisco路由器到
华为交换机,可以说是涵盖了市面上所有主流的软、硬件产品。
银行的系统管理员、网络管理员们面对不断增多的IT设备、复杂的各种系统以及被动应对式的人工管理,承受着强大的运维压力,当银行某一个关键业务出现故障时,需要对所有的硬件设备、软件平台进行全面排查,每一次故障就如同打响了一次协同战役。另一方面,对异常处理、服务请求没有标准的流程和规范,致使责任、绩效难以细化考核,管理也陷入困境。每天运维人员80%到85%的时间花费在服务支持方面,而这方面的工作大部分是日常的、重复的和低价值的。
以上现象,是发生在笔者一个朋友身上的真实故事。他身为某银行的高级系统管理员,每天却身陷在各种故障之中,经常加班到深夜,却不知在忙何物!这样的故事并非只发生在银行系统中,其他的很多企业,特别是部署了多种对实时性、连续性要求比较高的关键业务的企业,都会有类似的现象。