要想成为一名合格的网络管理员,具备良好的思考问题能力和严谨的解决问题思路是必须的,当然解决问题后得到的经验也是特别宝贵的。最近笔者为下属公司调试网络,虽然解决问题绕了很多弯路,但是最后还是成功的将网络故障排除,也得出了网络维护急不得这个经验。在此写出来和各位读者分享。
一,事情起因:
下午接到下属学校的网络管理员打来电话,告知学校中部分网络无法使用,急需上门调试。笔者立马开车前往故障地点。
开学校分东西两个校区,核心设备都放在西校区的中心机房,东区使用光纤连接西区并通过西区DNS服务器完成上网解析操作。实际遇到的问题是东区所有计算机无法上网,西区计算机访问网络没有任何问题。
二,故障现象:
西区计算机访问网络没有任何问题,基本上排除了学校服务器的故障。笔者马上奔赴东区放置交换机的机房,经过了解原来东区各个网络都是通过交换机连接到一起的,使用了两台实达2550交换机,这两台交换机通过后面板的堆叠模块堆叠连接到一起,其中一台实达2550被配置为主交换机,另一个是从交换机。在主交换机上通过光纤模块连接光纤至西区核心机房的交换机。
到东区堆叠交换机处一看,发现主交换机加电后所有交换机端口指示灯都呈红色,并不停闪烁。20秒左右后闪烁停止,所有指示灯熄灭,然后过一段时间后又会出现所有指示灯再次出现红色显示的现象,此现象反复出现,不管在指示灯呈红色还是熄灭状态下用笔记本连接到相应端口都无法正常上网,无法获得西区DHCP服务器提供的IP地址等信息。
三,初步分析问题:
由于笔者也曾经遇到过交换机所有端口对应指示灯呈现红色的问题,这个是广播风暴的体现,主要是因为交换机的某两个端口通过一根网线连接到一起。于是笔者根据这个线索进行查询,看有没有网线连接错误的问题。反复查看后没有发现任何问题,看来不是广播风暴造成的。
笔者将自己的笔记本通过网线连接到了东区主交换机上,发现对应的端口显示灯是绿色的,说明工作正常。这时笔者发现东区主交换机上面板显示M1(模块一)工作不正常,只有一个灯处于亮状态,其他显示速度,工作模式等指示灯都是灭的,这说明该模块并没有正常工作,而相应的M2这个堆叠模块则工作正常。笔者马上到交换机后面看看光纤连接是否正常,将光纤跳线重新插拔后TX灯始终不亮,而RX则始终亮着。看来是光纤模块或光纤线出问题了。
首先查看光纤线和接口是否正常,把光纤插头拔下在暗处可以看到有亮光,说明有信号,该插头是好的,也说明了从西区到东区这段光纤线路应该没有大的断开链路问题的出现。然后查看光纤接口,在暗处也可以看到有亮光,但是这还不能完全排除光纤接口的嫌疑。这时笔者继续怀疑可能出问题的部件,将关注点放到了交换机光纤模块和交换机内部模块插槽上。
首先检查交换机内部插槽——将主交换机实达2550后面的模块一(光纤模块)与模块二(堆叠模块)进行了互调,结果问题依旧存在,仍然无法正常上网,指示灯还是在红色和熄灭状态之间切换,由于之前交换机堆叠没有问题,所以可以保证交换机模块插槽没有问题。
接下来检查交换机光纤模块——由于附近没有合适的设备,所以只能将该交换机卸下来。拿着这个设备到西区去测试。
四,进阶分析问题:
把实达2550交换机拿到西区连接主交换机,直接用光纤线连接主交换机,问题依旧。看来从西区到东区的光纤链路问题可以排除了,因为在西区机房用光纤直接连接都会出现问题。
使用另外一条光纤线连接两个交换机,问题依旧。调换方向和TX,RX顺序后还是不能解决问题,看来也不是光纤的问题。
这时笔者已经可以很肯定的得出——光纤模块出问题造成的本次故障。于是我把光纤模块从实达2550交换机上拆了下来,将他安装到其他交换机上进行测试,来确认故障的原因。结果不测不知道,一测更糊涂,本来十拿九稳的以为光纤模块出问题,但是将他连接到其他交换机上工作却很正常,输入输出指示灯都显示正常。这下笔者可就如丈二和尚一样模不到头绪了。可能有的读者会说肯定是交换机坏了,不过这样说就太笼统了,有点不负责。而且这个学校的交换机刚刚通过验收,不可能这么巧这么快就损坏了。
眼看着已经晚上六点多了,但是问题仍然没有一点头绪。笔者不停的告诫自己要仔细,冷清。又反复想了想今天的故障和已经进行的诊断:
(1)故障不是广播风暴造成的,因为第一笔者查询了线路没有回路。第二将这个交换机搬到了西区没有连接任何网线的情况下进行测试,依然出现故障。
(2)不管是在东区连接网络还是直接把设备拿到西区都出现此问题,说明并不是链路的问题,所以说明从西区到东区综合布线没有问题。
(3)交换机的模块插槽是好的,因为将光纤模块分别插到模块一和模块二的插槽上都出现问题,而将堆叠模块插在这两个模块上可以正常工作。
(4)交换机使用的光纤模块是好的,将这个光纤模块插到其他计算机上可以正常工作。
(5)连接交换机的光纤和光纤接头是好的,因为笔者已经通过替换法排除了其故障可能性。
五,解决问题:
时钟已经指到了八点,但是笔者的思路还是有如一团乱麻。这时笔者突然想到能否将一个交换机的两个模块插口都安装光纤模块,这样让交换机自己接自己收,实现一个环路来查询故障的根源。于是将堆叠模块拆了下来,就在这时不知道是什么原因,我突然担心这样做环路是否会造成交换机的损坏!所以取消了这个念头,再次将交换机的电源打开来尝试,神奇的是问题再也没有出现,连接交换机的笔记本也能自动获得IP等网络参数了。
问题解决了,冷静下来的我终于发现了问题的根源,正是因为我把堆叠模块拆了下来,才使得光纤模块可以正常工作。看来是堆叠模块与光纤模块有冲突,两个模块之间存在冲突,所以在给交换机加电时才会出现比较奇怪的现象——所有端口指示灯都呈现红色。查询设备帮助手册后也发现了这个提示,当存在硬件冲突时交换机会出现所有接口指示灯红色的现象,在红色过后会自动将所有端口锁死,禁止网络的使用。
[1] [2]
总结:
看来本次故障是因为模块之间存在冲突造成的,以前笔者一直忽视这个问题,任何模块本身是产品功能的扩展,不会出现冲突或兼容性问题。当然本次故障的解决再一次让笔者相信,在网络维护与网络管理过程中不能着急,遇到问题不要慌张,多采用替换法和分块排查法。如果笔者能够分别检查两个模块单独工作状况的话,问题就可以早些解决。所以请各位读者在今后解决网络故障时一定要保持一颗平常心。
(出处:http://www.sheup.com)