1、一、造成服务器无法启动的主要原因 : 市电或电源线故障(断电或接触不良) 电源或电源模组故障 内存故障 (一般伴有报警声) CPU 故障( 一般也会有报警声) 主板故障 其它插卡造成中断冲突二、服务器无法启动 ? 检查电源线和各种 I/O 接线是否连接正常。 检查连接电源线后主板是否加电。 将服务器设为最小配置(只接单颗 cpu,最少的内存,只连接显示器和键盘)直接短接主板开关跳线,看看是否能够启动。 检查电源,将所有的电源接口拔下,将电源的主板供电口的绿线和黑线短接,看看电源是否启动。 如果判断电源正常,则需要用替换法来排除故障,替换法是在最小化配置下先由最容易替换的配件开始替换(内存、 c
2、pu、主板) 三、系统频繁重启 ? 造成系统频繁重启的原因: 电源故障 (替换法判断解决) 内存故障 (可从 BIOS 错误报告中查出) 网络端口数据流量过大(工作压力过大) 软件故障 (更新或重装操作系统解决) 四、服务器死机故障判断处理: 服务器死机故障比较难以判断,一般分为软件和硬件两个方面: 软件故障 硬件故障 软件故障 首先检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因。 电脑病毒的原因。 系统软件的 bug 或漏洞造成的死机,这种故障需要在判断硬件无故障后做出,而且需要软件提供商提供帮助。 软件使用不当或系统工作压力过大,可以请客户适当降低服务器的工作压力来看看是
3、否能够解决 硬件故障 硬件冲突 电源故障或电源供电不足,可以通过对比计算服务器电源所有的负载功率的值来作出判断。 硬盘故障 (通过扫描硬盘表面来检查是否有坏道) 内存故障 (可以通过主板 BIOS 中的错误报告和操作系统的报错信息来判断) 主板故障 (使用替换法来判断) CPU 故障( 使用替换法 ) 板卡故障 (一般是 SCSI/RAID 卡或其他 pci 设备也有可能造成系统死机,可用替换法判断处理) 注意:系统死机故障需要在处理完后需要在一段时间内进行一定压力的拷机测试来尽一步检查故障是否彻底解决。五、安装操作系统时提示找不到硬盘? 故障原因: 无物理硬盘设备 硬盘线缆连接问题 没有安装
4、硬盘控制器驱动或驱动不相符六、如何获得驱动程序? 使用随机光盘制作相应驱动七、为什么用正确的驱动仍然无法加载硬盘控制器驱动? 查看是否启用了 hostraid 功能。八、新购买的一块硬盘,安装到机器上之后,机器自检无法通过? 将新的硬盘取下,机器是否可以自检通过; 检查新增加的硬盘的 ID 号是否与原来的硬盘的 ID 号相同,如果硬盘的 ID 号相同的话,自检将无法通过。九、如何格式化 SCSI 硬盘? 有操作系统的情况:使用磁盘管理工具格式化; 无操作系统的情况:在 SCSI 管理控制界面格式化; 以 ADAPTEC Raid 卡为例:开机 -出现 CTRL+A 信息时,按 CTRL+A 进
5、 入-选中通道 A -选中 SCSI UTILITY-将检测到硬盘 -选中要检测的硬盘 -选中 FORMAT 可对硬盘进行全面格式化 选中 VERIFY 可对硬盘进行检测,检查是否有坏道 注意:在格式化硬盘时不能中断或停电,不然会损坏磁盘十、在 Aisino 系列中有 RAID 卡机器,当其中一个硬盘不能正常工作 RAID 报警,但系统能正常运行,怎么办? 用一个新硬盘,确保容量大于或等于不能正常工作的硬盘,最好用相同型号的硬盘替换即可。 RAID 卡相关常见故障 第一类: RAID 卡本身有问题 经常表现为 RAID 信息丢失,硬盘经常掉线,不能做 REBUILD,开机自检时检测不到硬盘或时
6、间长。 典型故障 A: 作完 RAID1,安装操作系统,一切正常,但第二次重启系统时,发出报警声,经检查发现一块硬盘掉线,REBUILD 后,又恢复正常,但重启后又掉线。怀疑为硬盘故障,校验硬盘后均无问题。最后更换 RAID 卡,故障解决。 典型故障 B: 机器经常死机,且有时候启动速度非常慢。观察系统日志,发现在系统启动时有这样一个错误提示:设备/devices/scsi/port0 在传输等待的时间内没有响应。更换 RAID 卡后,恢复正常。 第二类: 硬盘本身问题 表现为硬盘掉线,在 RAID 阵列中的状态为 DEAD,或者在作 REBUILD 时,作到某一进度就不能继续 典型故障: 硬
7、盘掉线后,做 REBUILD 时,作到 20%时出现错误提示无法继续进行。在确认掉线硬盘,硬盘盒及 SCSI 电缆都能正常工作后,对在线硬盘进行校验,发现有坏道,修复硬盘,重做REBUILD,恢复正常。 第三类: 硬盘盒或模组的接触问题 此类问题经常表现为 RAID 卡根本检测不到硬盘,此类问题比较简单,但在处理硬盘盒相关机器时,需要注意一些问题。典型故障: RIAD 卡中检测不到硬盘,把 SCSI 电缆接到主板的 ULTRA160 接口上,故障依旧,拔出硬盘盒(不包括硬盘盒后面的托架) 更换,故障依旧,更换硬盘,还是不行。最后卸下硬盘盒后面的托架(非热插拔部分),发现后托架上 80PIN 接
8、口上的一根针弯曲,校直弯针,恢复正常。十一、在服务器上使用的 SCSI 硬盘,为什么硬盘的 ID 号不能设置为 7? SCSI 控制器中,默认将 ID=7 设置为硬盘控制器占,所以硬盘的 ID 号不能设置为 7 十二、为什么开机自检无法通过? 解决方法: 机器切断电源,将机箱打开,用“COMS CLEAR”跳线的跳线帽将“COMS CLEAR”跳线的另外两个针短接(跳线参看主板说明书 ) 机器加电,自检,等机器自检完闭,报 CMOS 已被清除,然后将机器电源关掉,把跳线复原即可 机器重新开机十三、物理内存插槽报错 解决方法: 开机 -按 F2 进入“SETUP”-“ADVANCED” “MEM
9、ORY CONFIGURATION” 回车-“CLEAR DIMM ERRORS” 直接回车十四、为什么处理器报错或自检过程中只找到一个处理器? 解决方法: 开机 按 F2 键,进入“SETUP“ 1、依次“MAIN“ “PROCESSOR“ “CLEAR PROCESSOR ERRORS “ :将此选项值设置为“YES“ ; 2、依次“ADVANCED “ “RESET CONFIGURATION DATA “:将此选项的值设置为“ YES“ ; 3、依次“SERVER “ “PROCESSOR RESET “:将此选项的值设置为 “ YES“ ; 4、依次“SERVER “ “SYSTEM MANAGEMENT “:回车 “CLEAR EVENTLOG “ :将此选项 的值设置为“ YES“ 5、按 F10,保存退出