故障现象 笔者单位的财务中心工作人员反映,近3个月营业收入总数增加了近20%,但入账的营业收入却只增加了8%,怀疑财务系统是不是有问题,要求网络中心进行检查。笔者首先从财务服务器查看收支记录,没有发现什么问题。检查财务服务器上的软件,工作正常。
为稳妥起见,笔者更换备用的财务服务器,但是几天后,财务中心反馈的结果还是服务器不能正确记账。
诊断过程 这个故障比较棘手,看来需要对整个财务中心的网络进行一次大检查才能找出问题的根源。
笔者观察其网络结构,财务服务器连接到一台l6端口交换机的第一插槽8号端口。第9号端口下连接就是财务中心的100Mb/s的以太网,网管机也设置在这里。
笔者打开网管机的网管系统,准备观察8号端口的工作情况,这时才发现无法打开8号端口的工作表数据记录。询问财务中心的网络维护人员,告知1个月前因交换机出现故障曾自行更换过备用的交换机,更换后系统工作很正常。
笔者查看维护工作记录登记和日志,没有任何关于该交换机的维护说明,也没有关于网络工作参数的记录(记录上显示的还是财务系统开通时的原始数据)。笔者感到很奇怪,于是询问维护人员为何不设置并打开交换机工作表的Mib。回答说网管系统平时只用来看看系统设备是否连接以及是否有报警信号,更多的功能也不会用。由于自行更换交换机后没有发现什么问题,也没再仔细检查。
从网络维护人员这里没有得到什么有用的信息,要进行实际测试才能判断出故障的具体位置。笔者用网络测试仪的协议对话分析功能从网管机所在网段观察财务服务器的工作情况,发现服务器对约有1/3的数据包没有回应"为了不影响财务中心工作,笔者在下班后用户使用率低的时候,用F683网络测试仪模拟财务服务器测试8号端口,显示该链路工作于10Mb/s速率(原始记录显示这个端口的速率应该是100Mb/s)。由于交换机没有启动SNMP支持功能,所以笔者临时在交换机某空闲端口安装了一个10Mb/s的集线器与服务器连接,用网络测试仪从这个集线器的任意端口对财务服务器发送数据并观察服务器数据流工作情况,发现大量碰撞和错误的FCS帧,当流量为40%时,碰撞及错误流量占31%。笔者用电缆测试仪检查服务器连接电缆,发现靠交换器页端的插头处近端串扰严重。重新更换插头并正确打线,测试结果为碰撞率下降到0.6%,错误率为0%,比较正常。
于是笔者去掉临时集线器,重新启动交换机的SNMP功能,从交换机某空闲端口向服务器发送数据,用网管系统观察8号财务服务器端口,发现当流量为50Mh/S时,碰撞率、错误率、广播率等参数均表现优良,服务器恢复为100Mb/s链路速度。
为确认效果,笔者会同财务人员重新进行两组各30次实际测试,财务数据完全正确。可以基本肯定财务功能已全部恢复正常。 排除心得 通过本例故障,我们可以总结出一些经验:网络维护人员要对网络系统进行定期轮测(1至2年轮测一遍)。更换网络设备后一定要对网络链路进行测试(尤其是100Mb/S链路,必须用电缆测试仪测试)。另外,网管系统要指定专人进行维护使用,了般来讲,网管系统可以覆盖约30%左右的网络故障,因此重要的网络要安装并使用SNMP或RMON协议(多数网络设备都支持SNMP协议:部分支持RMON),启动网络中具备SNMP、RMON等功能的网络设备,否则网管系统将形同虚设。在平时的维护工作中,要求有及时完整的工作日志和异常情况记录,这对提高处理故障的速度是非常必要的。