扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
计算机网络中采用的光纤链路一般有以下几种用法:一是用于广域联接,将距离几十至几千公里的网络联接起来,如城域网、互联网Internet等。由于传输距离长,使用的光纤和信号光源一般是单模光纤和激光光源;二是用于区域联接,将数公里内的网络或建筑物联接起来,如校园网、社区网等。因传输距离居中,使用的光纤可以是单模(数公里)也可以是多模(数百米),信号光源一般也是激光光源、LED光源(数百米)或Vcsel激光光源(千兆以太网骨干联接);三是用于楼层内联接,如垂直干线或水平光缆布线(数百米或数十米),由于传输距离较短,多使用多模光纤和LED光源。区域联接或建筑物内的联接一般使用双光纤来分别承担收发信号的任务。光纤具有很好的抗干扰能力,甚至能抵挡核辐射和核爆炸引起的电磁风暴的冲击,密封的光纤还能很好地防止各种液体和有害气体的侵害。
光纤虽然有良好的传输带宽和稳定性,但光纤的损害确也经常出现。除了长途干线因为野蛮施工会被挖断、拉断外,多数传输性能问题出现在光纤接头处。光纤的传输衰减下降比较多地出现在接插联接点,通常的原因是脏污和受潮。脏污一般是在接触了手指后造成的,这在例行的常规检查(定期检查)时容易出现,一般建议定期检查时不要检查光纤链路中联接器件,也不需要检查备用的光纤联接器件。如果需要验证备用光纤链路是否正常,一般只在光纤链路的起始端做通断和衰减量对比检查即可,无须检查链路中间的联接器件。这样才能避免因为人为因素造成对光纤联接器件端面的污染。光纤联接器件端面受潮后会产生较大的衰减,这是由于光纤的衰减率与光纤中的一种离子的含量有非常大的关系,这就是普遍存在的[HO-].光纤中[HO-]的含量越低,光纤的透过率则越高。自然界中的水和空气中的水汽均含有足够的[HO-],光纤接头接触[HO-](受潮)后,其衰减量会大幅增加,导致整个光纤传输通道的衰减量增大,信号传输受阻。为了防止室内光纤接头受潮,对一般不使用的接插头都要求套上防潮防尘帽。但在实际的运行管理中,我们发现在调试设备后,未将防潮防尘帽还原者大有人在。
由此“惹”出的麻烦不胜枚举。不过,这次我们要给大家介绍的事例虽然系人为因素造成,但并不是因为没有盖好防尘帽子,而是另有原因。
示例
周末,某银行信息中心接到报告:该行某支行下辖的西区营业部网络瘫痪,营业部所管理的33台ATM取款机也全部不能提供取款服务,用户对此反响非常强烈。因为此故障已经持续两天了,尽管想尽了办法,仍然未能解决问题。
西区营业部和该支行在同一个大院的两幢大楼内,之间用一对90米的光纤将营业部的网络与支行的网络连接起来。路由器、服务器等都设在支行计算中心(100BaseT以太网)。营业部的网络结构为10BaseT以太网,几年来一直运行稳定,没有出现任何大的故障。5天前,营业人员发现网络速度变慢,用户也抱怨ATM取款机等待时间太长。当时由于营业部没有配备任何网络测试和维护的工具,为了排除网络故障,报请支行计算中心的网管人员负责检查。网管人员从支行一端的网络监测系统上检查,显示网络工作状态及流量、应用等一切正常。从计算中心打开营业部交换器的管理信息库Mib,观察流量也正常,数据显示为5%,同时观察只有很少量CRC/FCS错误,没有发现严重异常,用协议分析仪捕捉数据包观察,也未发现严重的问题,遂怀疑是恶意内部用户用病毒侵害营业部子网。虽然这种可能性不大,但管理人员也不能绝对排除这种可能性。昨日夜间进行了查杀病毒、重装系统、恢复数据等工作。开机后装载数据,网络基本恢复正常,速度缓慢的“症状”大大减轻。因为半年前安装了新的营业应用系统,随着业务流量的逐步增加,网管人员推断故障的原因可能是网络拓扑结构不合理,造成流量分布不均衡,通道受阻使得数据处理的延迟加大,从而造成业务应用的速度变慢。信息中心已经指定计划更新网络设备,并将于近期实施。其中,营业部级别的网络用户将全部升级为100兆以太网,以应付业务流量的增加带来的压力。但还未等到系统的“升级”计划实施,该支行的网络系统就因未能经受住昨夜暴风雨的考验(本周天气除昨天下午间晴外,连续降雨),最终于今晨“死网”。
为便于观察与营业部网络的数据流量“实况”,支行网管人员在计算中心将连接营业部的交换机用集线器暂时取代,企图从集线器的共享端口观测上下行数据的真实情况(因为从网管系统上观测基本正常),结果导致支行网络速度也跟者变慢。通知营业部检查其内部成员之间交换数据有无障碍,报告速度很正常。由此断定是营业部和支行之间的传输通道的问题。拔下营业部与支行联接处光卡的光纤插头,支行信息中心监测仿真业务的速度显示立即恢复为正常值,重新插上光纤上述现象旋即重新出现。进一步用Fluke DSP-4300电缆分析仪的光纤衰减测试模块测试光纤链路,其连接状况和链路衰减值均符合要求。故障排除工作随即陷于停顿。
仔细回顾网管人员检查此故障的全过程,光纤和交换机已经过了网管人员初步检测,基本正常,可以初步判定问题出在链路通道上。将F683网络测试仪接入营业部交换机进行观测,网络运行数据基本正常。接着进行光纤链路通道的测试,并检测营业部到支行的ICMP Ping测试结果,成功率约0.8%,路由追踪支行服务器,成功率约0.5%。从支行集线器上观察,流量18%,属正常范围,但网络测试仪屏幕上显示发现大量“幻象干扰”错误“Gosts”,比例高达16%。拔除光纤,则错误为0%,插上光纤,则错误值很快又变为16%.至此,可以肯定错误与营业部网络及其通道有关。将营业部与支行连接的交换机接口串入一个4端口的集线器,用F683网络测试仪观察网络,流量为5%,如我们所料发现大量幻象干扰(97%),拔除光纤,错误消失。沿着光纤链路的走向仔细检查光纤的联接状况,当寻找到光纤接线箱时,发现支行一侧的接线箱外包装已被撞击变形、破损(据说是半年前安装空调时被吊车臂碰坏),雨水已将3号接头完全浸蚀(3号接头用于连接营业部)。立刻清洁接线箱内的所有光纤接头,并用电吹风加热干燥光纤的插头插座,重新更换并密封接线箱,故障彻底消失。
分析本故障产生的原因,系光纤接头被雨水侵蚀和污染所至。从营业部送来的光信号被大量反射,此时若只测试光纤链路的物理性能是合格的。但由于此段光纤只有90米,来回的强反射信号经过较少的衰减后与正常信号叠加,破坏了数据的结构(包括数据帧帧头信号格式),网络测试仪即认为这是幻象干扰信号而不是正常的数据信号。此时只有少数信号可能侥幸通过。由于集线器和交换器不具备前期碰撞的识别能力,所以从网管上只能观察到数据帧后半部分被破坏后所表现出来的少量FCS/CRC类型的错误,此错误往往被人忽视。
虽然重装系统后因天气转晴,光纤接头性能有所好转,症状减轻。但后来的暴雨,使网络陷入不复的灾难境地。加上我们测试光纤链路显示正常,致使故障排除陷于停顿,束手无策。
光纤信号的反射只有交接箱一处发生一般还不会造成对单向光信号直接破坏,所以在整个90米链路中必定存在另外的反射点。为了彻底排除隐患,我们又检查并清洁了两端的插座和插头的光纤端面,以备不测。
光纤链路中如果因为跳线错用、端面联接质量不良等问题,均会造成信号的反射。如果只是一端的质量有问题,一般不会造成单向传输的光信号的破坏,但如果有两个以上的端面出现质量问题,则有可能引发错误数据的生成。对于比较长的链路,这种因来回反射造成的“信号噪声”一般不会对数据接收造成影响,但短链路就没有那么幸运了,通常的影响是因数据错误率上升导致网络速度变慢,严重时甚至不能实现光链路的联通。一般来讲,链路速度越高,受影响的程度也越严重。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者