扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
【原创】 2006年11月6日
关键字: 网络管理
正在承接新的铁路站段试点服务的中国铁通,正面临组织架构改革之后的一场变革,这场变革将会直接对整个数据中心管理上进行一次“手术”,中国铁通能否平滑过渡,使管理水平满足改革之后的业务需要。
信息化追求简单
中国铁通数据中心机房拥有直接连接国家骨干网、10G 的带宽资源。像中国铁通这样的电信级网络架构分支众多,结构很复杂,在这种复杂的网络结构中,在网络上“跑”的应用就很重要,对网络管理会提出更高的要求。
一直以来,铁道部遵循着:铁道部→铁路局→铁路分局→铁道段站的垂直树型管理架构。在出台的新政策中,铁路分局这个行政部门被取消,改为由铁路局直接对铁道站段进行管理。这种由树型架构向扁平型模式的转换,铁路局需要直接管理的车辆由1千台增加到上万台,管理压力一下上升了十余倍,在这个阶段的网络管理压力非常大。中国铁通企业信息化部副部长李金龙说,管理压力增大的主要原因还在于管理手段的陈旧落后,需要先进的信息化管理手段。但是铁道部中各站点站长大都是业务出身,从车长提拔出来的,他们的计算机水平有限,所以在信息化建设上还得追求简单的原则,最好“点三下就出结果”,这样才能有助于整体的管理,如果能建立起有效地监测方法,将会起到事半功倍的成效。
中国铁通数据中心需要对网络管理进行监测覆盖范围很广,还需要对列车时刻表查询、铁通在线、内部OA系统、内部采购系统、可视电话系统、运维信息系统、大客户服务系统、资源管理系统以及铁通流媒体等系统进行综合监测。
网络综合监测
中国铁通运用计算机进行管理已经有超过20年的历史过程,回忆起20年前的工作场景,李金龙皱了一下眉头,当时我还是一个网络管理人员,每天拿着一块抹布定时将机器擦一遍,当发现问题的时候,主要是看看接口是否有问题,工作很琐碎也很单一。
如今在中国铁通企业信息化部有6个网络管理员,在数据中心中已经开始通过统一化网络管理手段对故障进行定位,对分布在各个楼层中的几十台交换机、50余台网络设备、300个应用点和400余台服务器进行统一管理。
过去几年中,随着网络化应用的需求不断增长,数据中心配置了越来越多的差异化设备,以支持日益增加的用户和访问量,结果提高了成本和复杂性,同时影响了性能,在组织架构改革之后,网络管理平台也不得不进行更换。
李金龙说,现在通过可以通过SiteView ECC网络管理平台,可以设置报警通知的方式,省去了手工排查的工作方法。将复杂工作简单化,重复工作流程化、自动化,协同工作实现“一个团队”的意义。
中国铁通的系统管理员可以全面监测整个网络体系,例如网络的连通行(Ping)及其网络设备(路由器、交换机、防火墙)的状态,如端口,路由器CPU负载等。其中网络接口流量监测是网络监测中非常重要的一个指标,它包括四个最有权威的衡量网络性能的参数:输入流量、输出流量、输入丢包率、输出丢包率。
回收问题发现权
李金龙介绍说,在中国铁通的数据中心机房上,一个系统可能同时会有多个用户登录,我们的系统就得保证他们登录的界面是独立完整的,好像每个用户都是登录自己的系统一样。让他们操作各自的核心业务流程。这就要求数据中心在监测方面,首先得保持24小时的持续不断,这是最起码的要求。
曾经中国铁通总是被动接受用户信息反馈,当下属站段打来电话反应问题,信息中心的工作人员再去机房查找问题所在,在这期间不仅耽误了很多响应时间,而且还直接影响了公司的交流和工作进程。
现在的李金龙可以完全掌控网络的运维,他坦然说道,后来我们采用了网络管理后,问题的发现权重新掌握在我们的运维工程师手里,通过对监测点阀值的设定,当网络问题接近危险值的时候,系统就会发出报警通知。完全可以预先掌握问题隐患在哪,及时调整解决。
目前中国铁通的数据中心网络采用光纤对接,当SiteView ECC网络管理平台检测到网络流量出现异常、网络压力过大、路由器不稳定或核心交换机端口出现问题时,信息中心的工作人员就会提前采取一些措施,比如更换设备。可以确保网络正常使用,业务连续不受影响。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者