服务器故障排除方法
本文主要是针对一些服务器出现的简单的故障进行排查处理,主要分三部分,第一部分讲的是服务器故障排除的基本原则性问题,第二部分讲述了一些服务器硬件故障排除的实例,第三部分讲述了一些服务器软件故障排除的实例第一部分服务器故障排除的基本原则性问题一、服务器开机无显示应怎么办123456789检查供电环境,零火;零地电压?检查电源指示灯,如果亮,正常吗?按下电源开关时,键盘上指示灯亮吗?风扇全部转动吗?是否更换过显示器,更换另一台显示器。去掉增加内存。去掉增加的CPU去掉增加的第三方IO卡检查内存和CPU插的是否牢靠ClearCMOS
10更换主要备件,如系统板,内存和CPU二、服务器故障排错的基本原则是什么1尽量恢复系统缺省配置a硬件配置:去除第三方厂商备件和非标配备件;b资源配置:清除CMOS,恢复资源初始配置;cBIOS,FW,驱动程序:升级最新的BIOS,FW和相关驱动程序;dTPL:扩展的第三方的IO卡属于该机型的硬件兼容列表(TPL)吗?2从基本到复杂a系统上从个体到网络:首先将存在故障的服务器独立运行,待测试正常后再接入网络运行,观察故障现象变化并处理。b硬件上从最小系统到现实系统:指从可以运行的硬件开始逐步到现实系统为止。c软件上从基本系统到现实系统:指从基本操作系统开始逐步到现实系统为止。3交换对比a在最大可能相同的条件下,交换操作简单效果明显的部件;b交换NOS载体,既交换软件环境;c交换硬件,既交换硬件环境;d交换整机,既交换整体环境;
f三、服务器故障排除需要收集哪些信息?服务器信息:123456机器型号机器序列号SN如:NC00075534Bios版本是否增加其它设备,如网卡,SCSI卡,内存,CPU硬盘如何配置,是否做阵列阵列级别安装什么操作系统及版本(Wi
t4NetwareScoothers)
故障信息12345在POST时屏幕显示的异常信息服务器本身指示灯的状态报警声和BEEPCODESNOS的事件记录文件Eve
tsLog文件
确定故障类型和故障现象:1开机无显示;2上电自检阶段故障;3安装阶段故障和现象;4操作系统加载失败;5系统运行阶段故障;第二部分服务器硬件故障处理几例硬件故障是指服务器硬件出现异常而导致的各类错误。由于服务器构成比较复杂,因此在检查的时候必须认真、仔细。下面以一台万全4500为例说明。(例子,在实际问题中如果遇到相似现象,也需要具体问题具体分析,不要盲目套用);有一台万全4500,配有256M内存,使r