扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
两个IDC机房托管的服务器之间通信不畅,经查,两个机房间的丢包率在8%左右。这样的丢包率很容易引起TCP连接失败,由于网络在线业务异常重要,不得有片刻的停机。所以刻不容缓,马上处理丢包问题。
1.判断丢包发生在哪里
从办公室的计算机分别ping 两个机房的服务器,然后ping网关,通过对输出进行比较,发现问题出在办公地点—望京的机房。再用路由跟踪的方式测试,得出一样的结论。
2.现场排查
检查网段类服务器之间,服务器与交换机之间,以及交换机之间的网络通信情况时,发ping 包,没有丢包,但从网内ping 外部任何地址,都有丢包现象出现,路由跟踪有时不成功。这些情况可以表明网段内的通信是完全正常的。
接下来要做的事情就是测试网关的状态。网关是一个Cisco 6509交换机,是网通自己管理,我方的交换机通过一条双绞线与Cisco 6509相连,它是所有服务器的外联接口。通过技术手段,已经知道上联交换机的上联端口是Fa0/41。
(1)从网段内的某些服务器ping网关,发现丢包。
(2)从外网的某台计算机ping 这个网关,没有丢包发生。
(3)从外网的某些计算机执行到这个网关的路由跟踪,情况正常。
(4)用外网远程的交换机ping小包,情况正常。
(5)从网段内的交换机ping小包,发现丢包。
由上面的测试结果可以得出结论:是我方的交换机与网通交换机(我方服务器的网关)间的链路出现故障。前几天我方为扩容在机架上施工,有可能碰到了线缆。
于是查看交换机指示灯状态。发现有一个端口指示灯黄绿交替闪烁,仔细一看,是某个交换机的41号端口,而且网线上标明这条线是整个网段的上联线,即与网关相连的那条线,和先前测试出来的端口是一致的。可能问题就出现在这个交换机上。于是连上Console线,登录这台交换机,用命令“# show int f0/41”查看41号端口的输出,嘿嘿!居然变成半双工了。再查看其他一些端口的双工情况,均是自适应,询问IDC 机房的人,确认网关那个连接端口的双工配置,网关的端口为全双工。
好,马上进入配置模式,输入“# config t, int f0/41,# duplex full”就把交换机的41号端口设置成全双工了,保存配置。再查看41号端口指示灯的状态,变为绿色,这表明故障已经排除。从内外来测试丢包的情况,一切恢复正常。
3.原因分析
端口速率不匹配是引起丢包的最直接的原因。而引起端口速率变成半双工的原因可能是网络闪断引起的,比如网关那端的端口速率发生变化,而我方交换机的端口是自适应的,因此在协商后就变成半双工了。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。