案例回放:路由器频繁启动
笔者所处的市局科技网络与各个县市、区的科技网络,通过本地电信部门的2Mb光纤信道连接在一起架设成了全市科技系统的广域网,最近一段时间广域网遭遇了一则离奇的网络故障,所有各个县市、区的科技网络都无法访问市局的科技网络,当时正赶上在线申报市级星火项目计划,不少基层单位都在各个县市、区的科技网络中心等着在线申报市级星火项目计划,由于广域网出现意外,全市的在线申报业务不得不暂时停止下来,这在当时造成了不小的影响,局长立即批示要求网络中心必须全力以赴、迅速解决这起离奇的网络故障;故障就是命令,我们网络中心的几名同志一接到这样的命令后,就开始了对故障现象的排查与分析。
考虑到各个县市、区的科技网络都无法访问市局的科技网络,我们估计这则故障肯定与各个县市、区的科技网络无关,多半是市局的相关连接线路或网络设备发生了故障;顺着这一思路,我们在市局网络中心找了一台能够正常上网的工作站,在该工作站系统环境下我们打开了系统运行对话框,并在其中执行了Ping命令,来测试一下广域网的核心路由器IP地址是否能够Ping通,结果发现的确无法Ping通核心路由器的IP地址,接下来我们又Ping了一下局域网中的其他普通工作站的IP地址,结果发现到局域网其他工作站的网络连接很正常,从上面的测试操作来看我们几乎就断定广域网故障是担负信息中转“角色”的核心路由器引起的。
市局的科技网络使用了Cisco 7507型号的路由器设备作为整个广域网系统的核心路由器,检查该路由器的信号灯工作状态时,我们发现该设备控制面板中的system信号灯总处于不停地闪烁状态,很明显该设备工作状态不正常,同时发现核心路由器过一段时间就会进行重新启动。
案例解析:灰尘惹祸
为了检查核心路由器究竟发生了什么故障,我们使用Console控制线将核心路由器直接和本地局域网中的一台工作站相连,并依次执行该工作站系统中的“开始”/“程序”/“附件”/“通讯”/“超级终端”命令,打开了如图1所示的窗口,在该窗口中创建了一条与核心路由器直接连接的超级终端连接,进入超级终端控制窗口后我们发现核心路由器遇到了启动故障,同时系统还出现了“system received a Bus Error exception”这样的错误提示,通过这个提示我们确认核心路由器在启动过程中发生了一个总线故障,该故障引起了核心路由器不断重复启动。
考虑到总线常常位于设备的主板中,因此我们推测核心路由器的故障发生在主板中。于是一不做、二不休,我们迅速找来了“十”字形螺丝刀,将核心路由器背面的螺丝钉全部拧开,然后抽出其中的业务板卡,发现该板卡表面覆盖了一层厚厚的灰尘,再看看核心路由器内置的主板时,我们顿时惊呆了,该主板表面竟然也覆盖了一层灰尘,难道是灰尘的覆盖引起了路由器发生了总线故障?想起以前从网上看到的许多故障解决案例,都提醒我们在解决网络故障的过程中不要忽视一些细小的环节,特别是灰尘能导致网络设备发生各种莫名其妙的故障,于是我们也对灰尘进行了怀疑。
为了检验灰尘是否是引起核心路由器发生故障的“罪槐祸首”,我们立即开始了灰尘清洁干净。网络中心的几位同事分头行动,找来了柔软的小毛刷,专门用于电子设备的吸尘器,然后使用工具将核心路由器中的所有板卡全部抽取了出来,并通过小毛刷和吸尘器将核心路由器的主板和所有板卡表面的灰尘全部清洁干净了。清洁掉灰尘之后,我们又对主板中的各个芯片和电子元件进行了认真而详细的检查,以便看看主板中的电子部件是否存在烧毁现象,经过一番仔细检查后,我们并没有发现电子元件被烧坏的任何迹象。
于是抱着试一试的心态,我们将各块板卡恢复到原位,然后重新将核心路由器接入到网络中,并接通电源、按下开关进行重新启动,待路由器系统启动稳定后,我们重新Ping了一下核心路由器的IP地址,结果这一次发现Ping命令测试成功,再尝试进行在线申报项目时,发现操作也正常了。至此,广域网无法访问的故障就被彻底排查了,而引起该故障的“罪槐祸首”也被确认是让人容易忽视的灰尘。
总结
总结上面的故障发生原因,我们认为灰尘覆盖在核心路由器主板以及电子元件表面后,不但会导致核心路由器在长时间工作后散热不良,引发路由器工作不稳定现象的发生,而且在雨水多发的季节里,太多的灰尘特别容易吸收空气中的水分,这样一来潮湿的灰尘覆盖在电子元件表面时很容易导致核心路由器发生莫名其妙的故障。
所以,从上面的故障现象中,我们不难看出灰尘对网络设备的工作影响是多么巨大;为了确保网络始终处于稳定、高效运行状态,我们建议网络管理人员平时一定要做好网络设备的清洁维护工作,同时确保为网络设备提供一个干净、整洁的工作环境,只有这样才能提高广域网或局域网的网络运行效率。