在组建网络或者重新组合网络时,作为网络规划者的你就应该采用一些网络设计原理,有了这些原理,你才可以使你的网络少出问题,尽可能减少故障所能带来的影响,或者简化故障分析的过程。
在组建网络或者重新组合网络时,作为网络规划者的你就应该采用一些网络设计原理,有了这些原理,你才可以使你的网络少出问题,尽可能减少故障所能带来的影响,或者简化故障分析的过程。
你的网络不可能不发生故障。因此, 从现实的角度来讲,你的设计应当考虑到故障的问题。然而, 网络设计总是要面临商业的利益考虑各种平衡:效率与成本、性能与可维护性等等。虽然说网络设计要尽量减少故障率,但是这种减少很可能与其它的限制相矛盾。对于这些问题没有简单的解决方案。然而,这里有几条建议对许多类型的网络都适用。
在设计网络时考虑故障问题需要对系统如何产生故障有一个全面的了解。因此,在开始讨论设计原理之前,有必要首先回顾一下系统故障类型。这里将以几种不同的故障类型开始。尽管这种概括可能有些简单化,但是已经足够用了。
简单故障:
也许最简单的故障类型就是单一位置的故障或者一个简单故障。这种故障,出问题的部分仅仅是你的网络上的一个组件不工作了。理论上讲,哪个设备出了问题是很明显的,但是通常这并不是问题的关键。在许多种情况下,许多个设备同时出现了故障。比如说,如果网络的唯一一台DNS服务器出现了电缆连接故障,服务器就会无法访问,DNS也无法解析,其它服务中的电子邮件也不能运行。实际上,故障只有一个,就是连接器。一旦这个位置进行了修复,所有的问题都立刻消失了。
互相无关联的多个故障:有时候你可能会面临同时出现或者差不多同时出现的多个故障。通常你会有一种多重故障的错觉,就像上面的例子中所提到的一样,是电缆出了问题。但是有时候确实是不止一个设备发生了故障。在互相无关联的故障当中,出现故障的时间几乎完全是巧合,故障之间并无联系。不幸的是,无关联故障可能很难解决,原因有三:第一,你必须意识到确实发生了多重故障;第二,区分几种故障现象可能会比较困难。最后,总想去寻找根本不存在的关联是人的天性。这种天性往往会误导你。
连续故障:
一种故障引发的其它故障被称为连续故障。在这种故障中,每个故障都需要单独处理。比如说,突然断电会破坏接口。为了使设备重新工作,你必须修复或更换电源和接口(建议首先更换电源)。区分真正的连续故障和单一故障影响其他设备这两种情况会比较困难。但是尽管这种区别对于你的用户来说并无差别,可是在故障诊断时却很重要。
系统故障:
也许最致命的故障就是系统故障了。这是一个经常被滥用和误用的术语。系统故障源于系统组件之间意外、不明显的互相影响。这种互相影响可能是独立故障对于其它设备的作用,或者仅仅来自设备的不兼容。系统故障的发生条件是不熟悉的、未经计划的,或者没被发现的或者不能马上理解的意外的相互影响。多个简单故障如果没有相互影响就不算是系统故障。连续故障也不是,因为相互影响可以很容易理解。也许解释系统故障的最好办法是举一个例子。