科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网网络频道路由交换IDC机房托管服务器之间通信不畅 祸起丢包

IDC机房托管服务器之间通信不畅 祸起丢包

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

两个IDC机房托管的服务器之间通信不畅,经查,两个机房间的丢包率在8%左右。这样的丢包率很容易引起TCP连接失败,由于网络在线业务异常重要,不得有片刻的停机。所以刻不容缓,马上处理丢包问题。

来源:chinaitlab 2010年4月11日

关键字: 机房管理 机房故障

  • 评论
  • 分享微博
  • 分享邮件

  两个IDC机房托管的服务器之间通信不畅,经查,两个机房间的丢包率在8%左右。这样的丢包率很容易引起TCP连接失败,由于网络在线业务异常重要,不得有片刻的停机。所以刻不容缓,马上处理丢包问题。

  1.判断丢包发生在哪里

  从办公室的计算机分别ping 两个机房的服务器,然后ping网关,通过对输出进行比较,发现问题出在办公地点—望京的机房。再用路由跟踪的方式测试,得出一样的结论。

  2.现场排查

  检查网段类服务器之间,服务器与交换机之间,以及交换机之间的网络通信情况时,发ping 包,没有丢包,但从网内ping 外部任何地址,都有丢包现象出现,路由跟踪有时不成功。这些情况可以表明网段内的通信是完全正常的。

  接下来要做的事情就是测试网关的状态。网关是一个Cisco 6509交换机,是网通自己管理,我方的交换机通过一条双绞线与Cisco 6509相连,它是所有服务器的外联接口。通过技术手段,已经知道上联交换机的上联端口是Fa0/41。

  (1)从网段内的某些服务器ping网关,发现丢包。

  (2)从外网的某台计算机ping 这个网关,没有丢包发生。

  (3)从外网的某些计算机执行到这个网关的路由跟踪,情况正常。

  (4)用外网远程的交换机ping小包,情况正常。

  (5)从网段内的交换机ping小包,发现丢包。

  由上面的测试结果可以得出结论:是我方的交换机与网通交换机(我方服务器的网关)间的链路出现故障。前几天我方为扩容在机架上施工,有可能碰到了线缆。

  于是查看交换机指示灯状态。发现有一个端口指示灯黄绿交替闪烁,仔细一看,是某个交换机的41号端口,而且网线上标明这条线是整个网段的上联线,即与网关相连的那条线,和先前测试出来的端口是一致的。可能问题就出现在这个交换机上。于是连上Console线,登录这台交换机,用命令“# show int f0/41”查看41号端口的输出,嘿嘿!居然变成半双工了。再查看其他一些端口的双工情况,均是自适应,询问IDC 机房的人,确认网关那个连接端口的双工配置,网关的端口为全双工。

  好,马上进入配置模式,输入“# config t, int f0/41,# duplex full”就把交换机的41号端口设置成全双工了,保存配置。再查看41号端口指示灯的状态,变为绿色,这表明故障已经排除。从内外来测试丢包的情况,一切恢复正常。

  3.原因分析

  端口速率不匹配是引起丢包的最直接的原因。而引起端口速率变成半双工的原因可能是网络闪断引起的,比如网关那端的端口速率发生变化,而我方交换机的端口是自适应的,因此在协商后就变成半双工了。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章