故障现象:一台Intel奔腾3/550服务器,近期频繁出现几次蓝屏幕死机故障。趁死机关闭的机会,将内存由原来的128M升级到512M(普通内存),并且在系统CMOS设置中选择装入(Load)最优参数设置,对内存每个单元进行检测。开机后内存检测正常,但是屏幕提示须重新SETUP,按指定的[F2]键后却死机。
故障处理:按照缩小故障源的思路,换回原来的内存条,逐步去掉各个部分(软驱、硬盘、光驱等),故障依然。分析可能与系统SETUP设置有关,特别是关于对内存每个单元进行检测的设置。于是,拔出电池,对电池插脚短接放电,没有奏效。后来,找到主板清除CMOS跳线设置,将插脚线由1-2改到2-3一会儿,然后恢复原位,开机正常(编者提示:不要轻易拔出电池,而是要找CMOS清除跳线)。再次将内存升级,调整CMOS SETUP设置,特别注意到对内存的检测,设置为检测到每兆,至此系统完全恢复正常。 排障经验:本文故障发生的根本原因是服务器的内存缺省设置为ECC(带校验),由于使用普通不带校验的内存,而系统中设置每个单元都进行检测,所以导致了上面的故障。排除的方法是清除CMOS设置,调整有关参数设置。另外,CMOSSETUP装入最优参数设置通常有2种:一种是BIOS优化参数,这种参数稳定性最好;另一种是SETUP优化参数,优化整个系统,但是需要系统支持,其稳定性不能保证最好。所以,当系统出现故障时,不妨先将稳定性最好的参数装入,解决问题后再行恢复。
(出处:http://www.sheup.com)