扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
很多使用交换机的用户都遇到过很多问题,原因有很多,这里我们主要分析了由于交换机的位置安装错误,而出现的交换机网络故障。交换机是局域网中非常关键的连接设备,具有一定规模的局域网其交换机的不仅数量多,而且牌子也会比较杂。在这样的网络环境中,管理员要根据交换机的性能和其特性合理进行部署,因为您的不当部署会在后期的网络运维中埋下隐患。笔者和大家分享一个由于安装位置不当引发交换机网络故障的案例,希望对您有所帮助。
1.交换机网络故障现象
某中学的计算机房在一次计算机上机考模拟考试中出现了一个非常奇怪的故障现象:当学生在做模拟考试试题时,各客户端电脑频繁出现与服务器的网络连接中断的情况。但在出现故障时,每一台客户端电脑都能PING通服务器,时延小于10ms,只是从网上邻居里看不到服务器,并且故障出现时每一台客户端电脑又都能通过网上邻居互相访问。由于学生的最终模拟考试文件在本地机上操作后,都要保存在服务器上,此交换机网络故障导致该次模拟考试无法正常进行。
2.初步分析,与服务器无关
经过观察,发现故障是在访问服务器的学生数增加的情况下出现.于是开始时将故障点定位在服务器上,初步考虑可能服务器上的连接数设置有问题。在安装该服务器时,其连接数设置为999,而其他机房正常工作的服务器连接数设置的是256。是否连接数设置过大失效导致故障呢?于是我们将连接数依次降为512、256,重启服务器后故障依旧。根据实验结果.排除了连接数设置造成故障的假设。所使用的IBMX3600服务器是新买的,因此又怀疑故障是新设备与安装的考试系统有冲突造成的。于是马上搬来另一台备用服务器IBMX236,该型号服务器在另一实验室能正常使用.但当换上备用服务器后,故障依旧。至此,初步判断该故障与服务器无关。
3.定位故障源,问题出在一台交换机上
那么问题究竟出在哪儿?在这个局域网中除网线外只有3种设备:电脑、服务器和交换机。根据已经做过的测试,客户端电脑和服务器故障已经排除,PING能够连通说明网线也没有问题。于是考虑故障是否由交换机引起。实验室共有两种型号的交换机在使用,分别是神州数码的网易通DCS 2026和H3C S1024R交换机。为确定故障点,将实验室的20台客户端电脑和IBMX3600服务器全部接在了一台交换机上。首先对H3C S1024R交换机做了测试.在20台客户端电脑长PING服务器连通的情况下,同时向服务器上进行试题存盘操作,故障没有出现。接着将这20台电脑又接人到神州数码网易通DCS 2026交换机上,当在第15台客户端电脑向服务器存盘时,故障重现,由此初步判定这种故障原因出在交换机上。
4.数据测试,深入分析
为什么DCS 2026的交换机会引发网络故障呢?我们决定进行数据测试,为使测试结果更有说服务力,大家找来第3个厂家CISCO的355交换机,在同样的环境下再做测试。在测试过程中,首先保持测试的连线环境不变,三种类型的交换机都采用出厂缺省设置,在每台客户端电脑上准备了大小为845MB的文件,在将20台电脑依次接入神州数码网易通DCS 2026、H3C S1024R和CICCO3550后,将每台电脑上的845MB文件拷贝到利用网上邻居所看到的IBMX3600上的共享文件夹。在服务器上利用EtherPeek抓包软件对交换机上所有流经与服务器相连端口的数据进行了抓包分析。
(1).对DCS 2026交换机的数据测试
神州数码网易通DCS 2026在依次将客户端电脑的文件向服务器上拷贝时,只能支持l2台电脑同时向服务器拷贝,当第13台电脑向服务器上拷贝文件时,网络连接不可见,此时客户端长Ping服务器正常。同时,服务器上的端口流量也由12台时的62.284Mbits/s锐减到41.183dbits/s。通过分析交换机网络故障出现后的捕获数据包,发现41.183dbits/s的流量数据几乎全是Ping包一类的小数据包。
该现象说明网易通DCS2026交换机在端口达到63Mbits/s左右的流量时,对大尺寸数据包做了丢弃处理,对于Ping包这类小尺寸数据包进行了正常的转发,这也就是为何故障出现时各客户端能Ping通服务器,但无法通过网上邻居访问服务器的原因了。为排除单一端口故障,在网易通DCS 2026上换端口测试,结果一样。
(2).对H3C S1024R交换机的数据测试
在同样的软硬件环境下,H3C S1024R交换机在与其相连的第17台电脑向服务器发送数据时,故障出现。此时的流量由73Mbits/s左右减少到42.23Mbits/s,与神州数码的现象有所不同。所有电脑长Ping服务器都是正常的,并且先向服务器进行文件传送的9台客户端电脑工作正常.后8台电脑与服务器的网上邻居的连接中断。该测试结果表明H3C S1024R交换机没有对所有的大尺寸数据包进行丢弃,而是交换机内部对转发的数据进行了优先级处理。
(3).对cisco3550交换机的数据测试
在对CISCO3550交换机进行测试时,与其相连的2O台电脑在长Ping服务器正常的情况下,全都能向服务器进行正常的文件发送,其端口流量达到了101.4Mbits/s。上述测试均是在每种型号的交换机连接20台客户端电脑时进行的。随后我们依次在各交换机上只连接服务器和一台客户端电脑.由客户端向服务器传送前面测试中使用的同一个大小为845MB的文件,CISCO耗时180s,神州数码网易通DCS 2026耗时179s,H3C S1024R交换机则用了234s。测试结果表明,在交换机负荷较小的情况下,CISC03550和神州数码网易通DCS 2026端口流量相仿,而而H3C S1024交换机稍弱。
最后,对数据存盘操作时的数据流量进行了测试,通过抓包分析,在单台电脑上做数据的存盘操作时(向服务器上保存文件),在25s时间内我们对打开的工程文件连续点击保存按钮,向服务器进行存盘操作,平均流量达到了496kbits/s。机房中共有7台交换机级连.每台交换机均有24口,根据测试数据,学生在做试题时,对发向与服务器相连端口的并发操作总流量可进行如下计算:496x7x23=76.57Mbits/s。该流量大于前面测出的神州数码2026交换机单个端口的最大流量62.284Mbits/s。通过上述测试结果,我们可以得出结论:该次交换机故障的产生是由于所使用的神州数码网易通2026交换机端口流量受限造成。其根本原因在于,当转发数据量较大时该型号交换机对大尺寸数据包进行了丢弃处理。
5.解决方案
交换机网络故障解决方案如下:在设备的选择上,增加一台cisco3550或类似性能的汇聚交换机.或在现有交换机上添加千兆模块,并将服务器与其相连,网络拓扑由级连改为星型架构,接入交换机可继续采用H3C S1024R或类似性能的交换机。并将各接入交换机全部与汇聚交换机相连。
总结:充分了解网络的流量模式以及所使用交换机的端口实际最大流量,是能否发挥交换机作用的一个非常重要的因素。使用交换机的目地就是尽可能地减少和过滤网络中的数据流量,所以如果网络中的某台交换机由于安装位置设置不当,而几乎需要转发接收到的所有数据包的话,交换机就无法发挥其优化网络性能的作用,反而降低了数据的传输速度,增加了网络延迟,甚至因为生产厂家出于设计方面的考虑,对特定类型的数据包做丢弃处理,从而引发网络使用中的各类奇特故障。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者