故障现象
当计算机都无法接入Internet,从文档中查找到用户的IP地址后,试着Ping了几台,发现全部连接超时。然后,又Ping了一下图书馆楼的中心交换机却又很正常。
电子阅览室使用CISCO Catalyst 2950T-24-SMI作为集线设备:并通过一条双绞线与图书馆楼的中心交换机CISCO Catalyst 3550-48-EMI连接。既然机房内所有用户都无法连接。那么首先怀疑可能是级联电缆问题或级联端同的问题。于是,先到图书馆网管中心的机柜内查看了一下该级联端口的LED指示灯,没有发现明显异常。到电子阅览室机房厉。检查了几台计算机,发现不仅无法接入局域网络和Internet,甚至彼此之间都无法Ping通,也无法通过查找的方式找到对方。
诊断过程
数量如此众多的计算机网卡不可能同时损坏,因此,初步判断故障可能出在交换机、级联电缆和交换机端口上。于是,首先使用双绞线测试仪检测了网线的连通性,没有发现问题。将级联电缆插到Catalyst 3550交换机上的另一个端口,后来又插到另一台交换机上,故障仍没有得到解决。再看Catalyst2950T交换机的指示灯,凡是插有网线的端口,指示灯都亮,似乎没有什么问题。百般无奈之工,只能采用维修计算机时常用的方法 置换法,用另一个备用的交换机替换了Catalyst 2950T。然而,几分钟之后,计算机又无法访问Internet了,他们之间的通讯也断了。看来,问题并非出在Catalyst 2950T交换机上!既然不是交换机的原因,那么,是什么导致了该网段内计算机在几分钟内就失去了彼此之间的联系呢?原因只能是一个,那就是广播风暴,由网卡损坏而引起的广播风暴!
关掉Catalyst 2950T的电源,然后,坐到每一台计算机前,使用Ping127.0.0.1对Internet机房内的所有计算机逐一进行测试。当发现有网卡故障的计算机后,将其所连接的网线拔掉,再次打开交换机电源,网络终于恢复正常了。接下来的事情当然就是为计算机更换一块新的网卡了,这样就解决了问题。
排除心得
为什么图书馆楼内的其他计算机没有受到影响呢?既然都连接到同一台Catalyst 3550-EMI上,那么,所有图书馆楼内的计算机都应当发生连接故障才对呀。而交换机作为二层设备,所有与之连接的计算机都处于同一个广播域内:都应当遭受厂播风暴才是,非常有道理,但是为什么会出现这样的问题呢?为了提高通信效率,有效地避免学生对学校一些重要部分的攻击,保护敏感数据,我们划分了大量的VLAN,几乎每个学生机房都是一个VLAN。由于VLAN之间的通讯必须借助于第三层设备,在VLAN之间根本无法进行广播,所以,广播风暴就会被限制在一个机房(VALN)内。由此可见,在局域网络中,适当地划分VLAN,不仅有利于提高网络的通讯效率和网络安全,而且还可以有效地提高网络的稳定性,使一台或几台设备的损坏,不致影响到整个网络的正常通信。