网络故障问题分析

2016-01-18 12:16张海珊
电脑知识与技术 2015年33期
关键词:路由故障

张海珊

摘要:随着计算机网日新月异的飞速发展,采用网络测试基础命令来检测网络线路及路由是否连通,迅速判断网络故障问所在以及所遇故障种类,从而方便解决问题,是目前网络研究的基础问题。

关键词:网络测试;故障;路由

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)33-0037-02

当今网络的发展非常迅速,比如数据库和信息共享,查阅资料,以及互联网的连接等都离不了网络。在一个intranet的网络系统中,如果遇到网络连接问题,如何有效处理问题,并且迅速的解决出现的问题呢?这就涉及如何快速精确的测试网络的连通问题,如何迅速准确的侦测到故障问题所在。解决这些问题有时不需要很繁琐的工具,这里仅需要使用两个很基础的命令:PING 和 Tracert。在发现问题时,先根据现象判断故障类型,然后再判断是什么导致的问题,如下例所述。

1 网络基础命令简介

下面简要介绍下网络的基础命令

1.1 PING命令

PING 命令是 Packet internetwork groper 的缩写,主要用于测试一台主机或节点是否可达,不仅可以检测三层及以下网络的联通性,而且还可以测出目标主机和节点的往返时间,该程序发送一份Icmp回声请求报文包给目标主机,如果回声请求包成功到达目的地,并且目标节点或主机也发送回声响应的报文包给数据源节点或主机,就说明PING 成功了,这两点之间是可连通的。

1.2 Traceroute 命令

Traceroute 是用来跟踪一个数据包到达目的地所要经过的实际路径的命令,源主机向目的主机的一个无效端口顺序发送一组udp数据包,首先发送3个ttl=1 的数据包,当这个udp数据包在路径上遇到第一个路由器时,会引起并返回一个icmp超时信息,表示数据超时,同时也表示数据遇到了第一个路由器。然后,源主机再发送3个ttl=2 的udp数据包,同理,第二个路由器也返回 ICMP TEMs,以此类推,这样就显示出了数据包经过的路径上遇到的路由器的地址。

2 基本网络情况简介

市局和各区市局是通过广电ATM专线为主要通信线路进行网络的连接,通过网通互联网专线VPN网络做热备。如果ATM专线出现问题,再通过备份线路连通网络。市局和各区市局的网络是通过OSPF路由协议连通。

下面我们从工作中遇到的一个实例来说明遇到网络问题时如何侦测问题和排除故障。

3 问题侦测和故障排除

1)在测试网络时,我们发现从市局路由器到区市局1的路由器网络连接不通,测试情况如下:

当我们Ping 区市局1机器的IP地址时,显示TTL expired in transit错误提示,这表示TTL(生命周期)在传输过程中过期,导致这个问题的原因有两个:

1)TTL值太小!TTL值小于我方和对方主机之间经过的路由器数目。

2)经过路由器的数量大于TTL值!

要找出问题所在,就要用 TRACERT命令查看从市局机器到区市局机器经过的路由,测试结果如下:

172.18.A.241 ;市台交换机内网口

10.82.G.3 ;区市局1路由器外网口

10.82.G.1 ;市台交换机外网口

10.82.G.3

10.82.G.1

根据测试结果,找到了问题所在,应该是由于路径上经过的两个路由器形成了循环,数据包到不了区市局1的机器。

再用Tracert测试从市局交换机到区市局1路由器的IP地址,测试结果如下:

172.18.A.241

172.18.A.251

* * *

综合以上测试结果,我们可以推测到数据包已到达了区市局1路由器的外网口,但到不了内网口,通过这个测试结果可以分析,不是ATM专线线路的硬件问题,而是区市局1路由器设置的问题。

2) 在和区市局视频会商时,原来只是到区市局1线路测试不通,在连通了除这个区市局以外的各个区市局以后,不一会线路就都中断了,再使用Ping测试到各个区市局的线路就都不通了。

从这个故障现象,再结合以前区市局1出现的问题,可以分析出是各个区市局路由器学习了新的有问题的路由,从而导致线路中断。

在市局机器上使用Ping测试到区市局机器和区市局路由器的IP地址都不通,但是在市局路由器上可以通过Ping命令接通对方的路由器。

在使用Traceroute测试从市局路由器到区市局2机器经过的路径时,测试结果如下:

10.82.G.10 ;区市局2路由器的外网口

* * *

通过这个测试结果,可以分析出是数据包已到达了区市局2路由器的外网口,但是到不了内网口。

同理,登陆区市局2路由器上,可以ping 通市局路由器的外网口,但是到不了市局路由器的内网口。

使用Traceroute命令测试从区市局2路由器到市局机器经过的路径,测试结果如下:

192.168.D.254

27.233.31.193

119.167.124.1

* * *

从这个测试结果可以了解,因为ATM专线线路不通,所以区市局2路由器从VPN备份网络访问市局机器

3) 由于通过VPN网络比通过ATM专线的网速慢,所以要使市区市通信网络通过ATM专线线路通信,在未找到故障原因时,就要通过给各个区市局路由器的路由表添加静态路由,暂时解决这个问题,如下所示:

ip route 172.18.A.0 255.255.255.0 10.82.G.1

ip route 172.18.C.0 255.255.255.0 10.82.G.1

ip route 10.76.E.0 255.255.255.0 10.82.G.1

ip route 10.76.F.0 255.255.255.0 10.82.G.1

4 指定路由器

综合以上的情况,经排查分析,是区市局1路由器配置的路由器级别比市局路由器配置的级别高,并且配置为默认,导致了这个问题。

在以太网中,必须要选出一个指定路由器(DR)和一个备份指定路由器(BDR)来代表这个网络。当DR运行时,BDR不执行DR的功能,当DR失效时BDR才承担起DR的责任。

1)DR——Designated Router(指定路由器)

DR是整个OSPF网络中的领导者,网络中出现任何变化,都需要向DR汇报,再由DR向其他路由器发送该消息。

2)BDR——Backup Designated Router(备份指定路由器)

如果充当整个OSPF网络管理者的DR路由器发生意外情况,down了,则整个网络会因为失去了核心而变得混乱。BDR的作用就是在DR失效后顶替DR的位置,变成新的DR。

3)在多路访问网络环境中,多台路由器是互为邻居,如果他们之间都建立相邻关系并互相交换链路状态信息,则关系复杂,数据流量大。选举DR和BDR减少了这种复杂的关系。DR和BDR保证了网络上的其他路由器都有关于网络的相同的链路状态信息。在选举DR和BDR时,路由器在Hello数据包中相互查看优先级,并根据下面的条件确定DR和BDR:有最高优先级的路由器被选为DR,有次高优先级的路由器被选为BDR

5 总结

在一个DR、BDR正常的网络中,不能通过更改优先级或路由器ID达到夺取DR、BDR身份的目的。如果指定路由器设置有误,则会在网络中出现混乱,各路由器的链路状态信息也会出现混乱,在本例中,会商时,各个区市局的路由器学到了错误的路由,导致了网络中断问题。路由器级别问题解决了,网络也就恢复了正常。

猜你喜欢
路由故障
铁路数据网路由汇聚引发的路由迭代问题研究
故障一点通
探究路由与环路的问题
基于预期延迟值的扩散转发路由算法
奔驰R320车ABS、ESP故障灯异常点亮
故障一点通
故障一点通
故障一点通
江淮车故障3例
PRIME和G3-PLC路由机制对比