扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:zdnet安全频道 来源:论坛整理 2008年11月21日
关键字: 交换机
网络停顿两个小时后
A公司是一家制造型企业,设有办公室、财务部、一车间、二车间等多个部门。2003年公司采用了Cisco系列交换机来构建整个企业的千兆网络系统(如图1)。
图1 改造前的网络拓扑结构图
其中,网络的核心层采用的是Cisco Catalyst 6509设备,汇聚采用的是Cisco 3560G,接入层采用的是Cisco 2950系列交换机。所有交换机之间均采用光纤进行连接。
2008年,该公司的ERP系统正式上线运行了。生产、采购、销售等各个部门的业务处理全部依赖该ERP系统。突然有一天,公司的核心交换机引擎发生故障,导致整个网络系统中断,各个部门均不能使用ERP系统,整个公司的业务几乎停顿。所幸集成商及时赶到,提供了备份引擎,及时解决了这次突发事件。但是整个网络停顿了将近两个小时,造成的损失很大。
事发后,公司尽管更换了核心交换机引擎,恢复了系统的正常运行。但是作为CIO的老刘心里还是很担心:目前公司的经营管理都依赖ERP系统,如果网络系统出现故障,则意味着生产经营的停顿。这次虽然及时解决了故障,但是难免下次还会再次出现类似的安全事故。想到这里,老刘一阵寒战。经过仔细思量,老刘决定成立网络改造项目小组,对公司现有网络系统进行分析和改造,构建一个高安全性和高可靠性的网络系统。
经过对现有网络的状况进行分析,项目小组总结出了公司网络系统存在的几个典型问题:
1. 现有的Cisco 6509核心交换机引擎是整个网络系统数据转发的关键。因此,交换机引擎的失效就意味着系统的瘫痪。而公司的核心交换机一直以来采用的都是单引擎,这也是此次安全事故发生的根本原因所在。
2.除了核心交换机可能出现故障外,一般汇聚层和接入层的交换机也可能发生故障,而且其故障发生的频率明显要高于核心交换机。虽然此类故障发生时不会影响整个网络,但也会造成局部网络瘫痪,从而产生小的安全事故。
3.链路也存在发生安全故障的可能性。因为原有系统铺设的光缆均为6芯,但在实际使用过程中只融接了其中的2芯。一旦链路中断,故障也就不可避免。
改造网络的两种方案
基于此,项目小组认为要想保证各项业务的正常运行,网络必须具有高可靠性,决不能出现单点故障。这就需要从整个网络的结构设计、设备选型和日常维护等方面出发进行网络的高可靠性设计和改造。同时,关键设备要采用硬件备份、冗余等可靠性技术,以提高安全性和可靠性。针对该公司网络的实际情况,其可用性设计要包括网络设备本身的冗余能力和网络的冗余设计。而当前的关键是建立N+1备份系统,一旦主系统发生故障,仍可采用备份系统维持运行。经过深思熟虑,项目小组提出了两种解决方案。
方案一:考虑到引擎是6509交换机,决定增加1台引擎作为备份;增加一台6509交换机以进行核心交换机冗余,该交换机的配置要与当前6509交换机一样;在链路冗余方面,主干连接(主干设备之间及其与汇接设备之间的连接)要具备可靠的线路冗余方式;在路由冗余方面,采用动态路由协议以实现路由冗余,当链路中断时,路由能够迅速收敛。
方案二:首先对核心交换机进行冗余;其次对网络系统中的光纤链路进行冗余;最后,进行汇聚层交换机冗余,汇聚层设备虽然可靠性较高,但是也存在设备的单点故障问题,因此需要对汇聚层交换机进行冗余。
项目小组经过讨论,最终认为,方案二中双汇聚交换机能够消除汇聚层设备的单点故障问题,相对来说具有更高的可靠性,但成本相对更高。同时,其实施和日常维修管理的技术难度也将大大提高。而方案一对核心设备和物理链路都进行了冗余,问题考虑得更为全面,而且实施成本较低。因此,项目小组决定采用方案一对公司的网络系统进行改造。同时,对于汇聚层、接入层采用N+1的备份方案,即各购买一台汇聚层交换机和接入层交换机作为日常备用产品,并不投入系统运行。
实施安全的改造方案
按照原定的设计方案,在核心层增加一台Cisco 6509交换机,其配置与原有的Cisco 6509配置相同,均放置在核心机房。同时,在汇聚层交换机上增加一块光纤模块,上连到新的Cisco 6509交换机。由于重新铺设光缆成本较高,而原有系统铺设的光缆均为6芯光缆。因此,要充分利用剩余的4芯,接入层保持不变(如图2)。
图2 改造后的网络拓扑结构图
链路聚合技术 链路汇聚是指将多个交换机之间、交换机和路由器之间以及交换机和服务器之间的并行链路同时使用,其功能是将交换机的多个低带宽端口捆绑成一条高带宽链路,从而实现链路的负载平衡,避免链路出现拥塞现象。通过该技术,可将最多8条链路绑在一起,叠加传输带宽,从而使快速以太网和千兆以太网实现最高800Mbps和8Gbps的连接带宽。同时,当部分端口聚合链路出现故障时,也不会导致连接中断,其他链路将能够不受影响地正常工作,从而增强了网络的稳定性和安全性。
单条GE链路在正常状态下的链路带宽为1G,采用链路聚合技术对两条链路进行聚合后,其上行带宽可由原来的1G变为2G,同时,当其中1条链路中断时,整个链路仍可采用1G速率正常通信。这样就实现了链路的冗余。
在进行端口聚合的配置时,有大量的参数可供选择,本案例仅选取基本的参数进行配置。
热备份路由协议 由于当前网络均采用Cisco网络设备,因此可以采用Cisco的热备份路由协议(HSRP)实现路由冗余。HSRP的目的在于当有冗余交换机的时候,使主机看上去只使用一个交换机,并且即使在它当前所使用的交换机出现故障的情况下,仍能够保持路由的连通性。HSRP协议中所涉及到的多个交换机都映射为一个虚拟的交换机。如果核心交换机A和核心交换机B的默认地址分别为192.168.1.2和192.168.1.3,虚拟交换机的地址为192.168.1.1,那么对于其他设备来说,只有一个虚拟的交换机,其地址为192.168.1.1。
HSRP使主交换机代替虚拟交换机进行数据包的发送,终端把数据包发向该虚拟交换机,而实际转发数据包的却是主交换机。假如这个主交换机在某个时候由于某种原因而无法正常工作的话,那么备份的交换机将被用来代替原来的主交换机,承担数据包的转发功能,而不会在对主机的连通性上产生大的故障。
网络中的主交换机和备份交换机在完成HSRP协议的选择过程后发送消息包来实现主、备交换机之间的信息交换。假如主交换机失效,则备份交换机将取代它作为新的主交换机工作。而当备份交换机失效或者变成主交换机时,另外一个交换机将被选为备份交换机。一般根据需要选择部分配置作为交换机的实际配置并在主、备交换机上同时实现。
基于以上方案,项目小组顺利完成了对公司网络系统的改造。老刘认为,网络系统的安全性和可靠性是全部业务运行的安全保障,系统安全也就意味着可靠性。公司网络系统经过本次改造,基本可以保障业务系统的安全运行。
此外,在网络系统的建设中,还要注重系统维护的方便性和可管理性。过于复杂的系统对技术人员的素质要求和系统的恢复时间等都提出了很高的要求,如果不能满足这些要求,反倒成了不安全因素。因此,在系统安全的建设中一定要把握好这个度。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。