科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网网络频道探索问题实质:让网络故障一览无余

探索问题实质:让网络故障一览无余

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

不错,网络随着其频繁的扩容以及不可避免的多样性而越来越复杂,但是网络故障在当前最关键的变化是我们看待它的方法。工作状态下测试网络,运行时实程序是对多层次、多平面系统的复杂动态网络中的设备进行精确测试的唯一方法。

作者:中国IT实验室 2007年8月28日

关键字: 网络管理 路由器 交换机 网络管理软件 网络管理员 网络管理工具 网络排障

  • 评论
  • 分享微博
  • 分享邮件

  由于企业网络带宽的要求增加了,网络的复杂性也随之增加。这种增加不可避免地提高了网络出错的可能性。但是这并不是一个非常古老的问题。不错,网络随着其频繁的扩容以及不可避免的多样性而越来越复杂,但是网络故障在当前最关键的变化是我们看待它的方法。

  传统对网络物理层标准的测试方法是通过替换进行测试和评估。市场上也有很多用来对网络组件进行测试和评估的设备作为整个系统的功能组成部分。对于每一个兼容的组件、段都采用固定的程序进行测试。然而,现在新的技术已经可以对整个工作中的系统,通过基础设施的多个物理层进行多功能多系统测试。

  有调查结果表明,局域网中50%的故障源于物理层。然而,现行标准的测试设备因为有限的测试范围而不能精确显示出到底系统中的哪个部分出了毛病,如在一个被动网络中的一个子网或者一部分,或者一个简单的基础设施的物理层出了故障,网络是否通畅的判断过分依赖于连接指示灯。

  

  为了在企业范围内有效测试网络效率、吞吐量、带宽以及可用性,整体测试和量化在有效解决问题方面能够起到关键性作用。同时,由于网络速度越来越快,故障检测仅仅停留在简单的布线和连接方面是远远不够的。网络接口卡(NIC)的速度已经从十兆升级为千兆,它们需要性能表现更为精确的窗口。更何况,网络面临着永无休止的与其他数据网、电话网、HVAC 系统以及无线网络配合的干扰的机遇。

  

  工作状态下测试网络,运行时实程序是对多层次、多平面系统的复杂动态网络中的设备进行精确测试的唯一方法。关闭部分网络的检测方法可能会导致错误无法被发现。由于大多数网络由来自不同商家的设备构成,并且在广泛的层次上都是IEEE 和TIA/EIA兼容的,因此在时实状态下对系统进行工作状态检测,是唯一有效发现传统方法无法发现问题的方法。

  

  标准的测试方法会显示网络出现的错误或问题。但是一直到现在,这种技术还是不能找到故障发生的确切位置,也查不出故障发生的原因。这个问题的解决方法通常就是没完没了的取代测试——用已经验证过的工作正常的设备取代可能有问题的设备,以及依靠丰富的经验进行猜测。

  

  为了了解隐性故障,有必要进行除了个别设备对IEEE和TIA/EIA的兼容性测试之外更深入的检测。对于整个系统进行测试非常重要,同时,在企业规模上进行所有设备同时运行时的互操作性的检测也不容忽视。换句话说,积极的网络测试也需要进行苛刻的标准兼容性测试。这是很重要的一步,因为尽管所有的设备在工厂里已经进行了测试并能达到业界内的“临界值”,但是许多工作在超出标准参数的设备互相配合时可能会降低系统的“临界值”。

  

  网络故障的造成通常有很多种因素,包括IT员工的频繁更替,以及IT经理对系统的更改没有备案等。在很多情况下,IT经理都想跟踪网络故障的发生但是没有现行网络设置的精确拓扑图。

  

  传统的工具只能显示每个子网的主机情况,而对于这些主机确切位置的了解则不得不靠猜测去完成。Vigilant 能够完全重新侦测整个系统,对网络中的每个设备都重新进行描述并显示他们的具体物理位置,提供广泛的信息,包括MAC地址、IP地址、用户名、hub端口、网卡端口以及距离的远近等。这种跨越层次对每个设备的深入的识别可以快速判别故障发生的具体位置。

  

  检测与故障排除可以通过分析来加以区别。传统的测试方法类似于对未知目标执行搜索和救援任务,而智能故障排除方法则相当于执行已经制定的针对可以立即识别的敌人的战略。

  

  现有的网络检测诊断的局限所在是它们可以发现网络中存在的问题,但是不能确定到底是什么问题以及问题出现在哪里。比如说,手工检测缺乏诊断能力,如交换机端口参数以及NIC工作情况。传统的远程监控软件和协议分析软件只能是收集数据如网络上数据包传送情况。但是尽管他们能发现大量的丢包现象或者网卡冲突,这些设备还是不能确定到底是哪个设备工作不正常。

  

  因此,IT员工经常面临着尝试很多种方法,如重新配置系统、改变服务器、换掉跳接线,或者从一个端口换到另一个端口。发现故障具体位置几乎就是在碰运气。

  

  百分之一的出错率所带来的反复数据传输可能会给企业网络连接带来百分之八十的性能损失。百分之一是个小数字,但是可能代表着大问题。

  

  许多网络运行远远低于网络本身的带宽和吞吐能力。这种情况通常源于网络物理层所隐藏的问题。最近的调查表明网络故障所带来的损失同1994年相比增长了6倍,而Standish公司的调查表明网络传输的中断可能会导致公司每分钟达10万元的人民币损失(假设这家公司有1000位用户)。如果网络中有一个IT员工不能马上识别的故障,采用传统的测试排除法进行故障查找(或者古老的搜索——拯救法)可能会导致资源的巨大浪费和更严重的网络中断时间。

  现在已经出现一种新技术,它可以深入表层,对网络物理层深处的数据传输进行分析,就像X射线一样把用普通方法无法看到的东西看得清清楚楚,让管理者立刻识别企业范围的任何故障类型和故障发生的具体位置,从而使得资源资源的配置不再面向故障查找而直接面向故障解决。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章