扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
当组网规模相对较大后,肩负网络数据转发、内容过滤以及管理控制任务的交换机工作“负荷”就会很重了。而且与人身体的健康状况一样,交换机长时间超负荷工作之后,它的健康状况也容易出现问题,轻则出现反应迟钝的问题,严重的话能直接发生硬件损坏现象,从而会影响整个网络的运行状态。这不,笔者所处大楼网络有一台普通交换机,已经为大楼用户默默工作了好多年,一直以来它都是昼夜不停地为我们“服务”。可是,最近大楼网络中出现了许多计算机同时不能上网的故障现象,经过网络管理员的仔细检查,发现这台普通交换机竟然出现了意外,它的所有信号灯都在不停地闪烁;考虑到这种故障具有一定的普遍性,笔者下面就把该故障的详细排除过程还原出来,以便帮助各位朋友提高故障的解决效率!
惊见网络蜗速现象
笔者的一位朋友租了某单位大楼的培训机房,对外面向附近的大学生进行网络培训,培训机房中大约有80台左右的计算机,这些计算机全部通过普通的100M双绞线连接到两台普通交换机上;为了方便控制各个培训终端计算机的上网状态,所有计算机都通过一台代理服务器进行中转上网,网络出口线路租用的是本地电信公司的独享2M宽带线路,平时每台计算机的上网速度都比较快,而且每台计算机相互之间进行共享访问时,速度也是非常的快捷。
最近,为了迎接计算机中级考试,朋友准备对培训机房中的每台计算机上网连接进行一下调试,确保它们都能与代理服务器正常访问。可是,当朋友任意打开一台终端计算机,尝试上网访问代理服务器中的数据内容时,发现计算机浏览代理服务器站点内容的速度特别慢,简直就象蜗牛一样在爬行。刚开始的时候,朋友还以为是这台终端计算机同时运行的应用程序比较多,造成了本地计算机系统资源被过度消耗,从而引起了上网反应迟钝现象,于是立即重新启动了一下该计算机系统,等到重新启动成功后,再次进行上网测试,结果发现访问速度还是象蜗牛一样。
逐一寻找故障原因
1、排除终端计算机因素
起初,朋友怀疑这可能只是终端计算机自身的问题,造成了代理服务器访问速度非常缓慢。于是,他打开这台故障计算机的系统运行对话框,在其中使用ping命令测试代理服务器的IP地址,结果发现测试无法成功;更换一个新的IP地址后,继续进行网络访问测试,可是结果仍然还是一样的不成功,难道是故障计算机与代理服务器之间的网络连接线路出现了故障?朋友有点不放心,他立即尝试着将连接故障计算机的那条网络线缆水晶头拔下来,然后按照正常的方法重新插了一遍,继续测试还是不行;会不会是网络线缆自身发生短路或断路了呢?找来专业的网络测试仪器,测试网络线缆的连通性,发现连接故障计算机与交换机的那条线缆连通性一切正常,看来问题与连接故障计算机的那条网络线缆也没有任何关系。
在找不出终端计算机的自身问题后,朋友怀疑该计算机系统有问题,打算重新安装一遍系统;可是考虑到重新安装系统的时间比较长,而且操作系统只要能够正常启动,那么它的状态往往很少会影响到网络连接状态,还是看看其他计算机的网络连接状态,再作重新安装系统的决定吧!想到这一点,朋友又打开了培训机房中的另外一台计算机,并在该计算机系统中尝试访问代理服务器,让朋友万万没有想到的是,竟然从这台计算机出发,访问代理服务器的速度也不正常;之后,朋友又连着测试了几台计算机的网络访问状态,发现它们的速度都象蜗牛一样。显然,这种不正常的故障现象,与终端计算机自身的因素没有任何关系,如此说来重新安装操作系统的任务就可以免了。
2、排除代理服务器因素
既然连续从若干台终端计算机上进行网络访问测试,都是一样的故障现象,那会不会是代理服务器自身反应迟钝,造成了它不能正常响应各个终端用户的上网请求呢?考虑到代理服务器运行时间一长,它的系统资源很容易被大幅消耗,在这种情形下,代理服务器容易反应迟钝;为此,朋友决定先重新启动一下代理服务器系统,以便释放它的宝贵系统资源。想到做到,朋友立即赶到代理服务器现场,重新对它进行了系统启动,待系统启动成功后,朋友先是在代理服务器上进行了Internet访问测试,测试发现该项操作是正常的,之后又尝试从终端计算机来访问代理服务器中的数据内容,原本以为这种方法可以解决问题,可谁曾想到,这样的努力还是没有取得任何效果。
有没有可能是代理服务器中的防火墙,在暗中作祟呢?为了排除各种可能因素,朋友决定还是先暂时关闭一下安装在代理服务器系统中的防火墙程序,确保它不会影响各个终端计算机对代理服务器的访问;然而,当朋友将防火墙程序临时关闭后,发现终端计算机的网络访问测试还是和以前一样,非常缓慢,这说明网速奇慢的故障现象与安装在代理服务器系统中的防火墙程序没有直接关系。
在关闭了网络防火墙后,朋友发现没有取得任何作用,又开始怀疑代理服务器系统中是否存在网络病毒了,因为很多时候网络病毒能够制造出各式各样的奇怪故障,这一次会不会是网络病毒堵塞了通往代理服务器的网络传输通道呢?为了验证自己的猜想,朋友找来了最新版本的杀毒软件,对代理服务器系统的各个角落进行了全面、彻底地病毒清查操作,在查杀过程中朋友的确找到了一些网络病毒,见到这些病毒被清除干净之后,朋友简单地认为代理服务器不能正常访问的故障现象应该自动消失了,可是再次测试网络访问状态时,发现故障现象一切照旧,这说明代理服务器自身的运行状态是正常的。
3、排除网络连接因素
通过上面的检查,朋友发现代理服务器系统在重新启动之后,操作很流畅,不存在系统死机的现象,而且从代理服务器出发,朋友可以正常访问Internet网络,这说明外网通道是畅通的;现在代理服务器中的防火墙程序已经被关闭了,网络病毒也被清除干净了,唯一没有排查的就是代理服务器与交换机的网络连接没有检查,难道是代理服务器与交换机之间的网络连接通道被堵塞了,造成局域网中的其他计算机不能快速地访问代理服务器中的数据内容?
于是,朋友决定重点检查一下代理服务器与交换机之间的网络连接状态。他先是打开了代理服务器的系统运行对话框,在其中执行ping命令,来测试交换机的IP地址,发现该地址有时候能够被ping通,有时候不能被正常ping通,如果向交换机发送稍微大一些的数据测试包时,交换机的IP地址干脆就一直ping不通,看来代理服务器与交换机之间的网络连接通道的确存在问题。会不会是代理服务器的内网连接接口出现了松动呢?朋友打算将连接内网的那条网络线缆,从代理服务器的内网网卡上拔下来,然后重新插一下,看看是不是内网连接出现了松动现象?想到做到,朋友立即拔下那条连接内网的网络线缆,可是让笔者感到十分意外的是,当再次将网络线缆重新插上时,朋友觉察到网卡信号灯立即进入狂闪状态,好像在不停地处理数据信息,刚刚接入网络,代理服务器哪会突然接受到这么大容量的数据信息呢?难道内网网卡工作状态不正常?朋友有点将信将疑,但还是打开了对应系统的设备管理器窗口,从中找到了内网网卡设备选项,并用鼠标右键单击该设备选项,从弹出的快捷菜单中执行“属性”命令,打开内网网卡的属性设置界面,点击其中的“常规”标签,在对应标签页面中朋友发现内网网卡的工作状态是正常的;既然网卡设备是正常的,那么为什么该网卡设备的信号灯在一直狂闪呢,难道交换机在不停地向它发送数据包?朋友立即赶到目标交换机现场,根据各个交换端口上粘贴的标签说明,找到代理服务器内网网卡的连接接口,结果发现对应交换端口的信号灯也处于不停狂闪状态,更为奇怪的是,有一些交换端口上明明没有连接网络线缆,但是这些端口上的信号灯照样处于不停闪烁状态,难道交换机被大容量的数据信息堵塞了?
对症下药解决故障
那些没有上网的交换端口也能不停闪烁,这说明局域网交换机的工作状态出现了问题,这样一来任何一台计算机企图通过该交换机访问代理服务器时,自然也就不正常了。故障位置既然定位了,那么故障现象解决起来自然也就容易了。朋友估计故障交换机所有信号灯都在不停地闪烁,可能是遭遇到了大流量数据信息的堵塞,这种堵塞现象很容易让交换机“忙”不过来;于是,他尝试着将故障交换机设备的电源关闭了一段时间,之后重新接通它的电源,同时将代理服务器系统也启动了一下,以防止出现记忆效应。做完这些工作,朋友再次观察了一下代理服务器的内网网卡信号灯,发现这一次它的工作状态正常了;再赶到故障交换机现场,他发现交换机的所有信号灯状态都恢复了正常,看来交换机被堵塞的现象已经消失了。
在“疏通”了代理服务器与交换机之间的网络通道后,朋友重新选了一台终端计算机,并在该系统中尝试访问代理服务器系统的数据内容时,发现上网速度果然恢复了正常;之后,又任意选择了局域网中的其他计算机进行上网测试,朋友发现所有的计算机都能正常上网了,至此,上网狂慢的故障现象已经被成功解决了,而造成这一故障的“罪槐祸首”自然就是被大容量数据堵塞了的交换机了。
故障排除总结回顾
从上面的故障排除过程来看,此次网络故障是由交换机被大流量数据堵塞引起的,如果我们直接对交换机工作状态进行排查,那么故障排除起来速度就会很快。可是,在实际检查网络故障时,朋友由于简单地认为交换机设备平时性能稳定,很少出现故障,于是在这次故障排除过程中,忽略了交换机的问题,这样一来故障排除起来自然就多走了许多弯路。为此,我们建议各位朋友日后在检查网络故障时,尽量不要把眼光只停留在其中一个节点上,而要对整个网络连接系统做综合观察、判断,这样才能提高网络故障解决效率。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者