收藏 分享(赏)

服务器维修维护案例.doc

上传人:s36f12 文档编号:7824791 上传时间:2019-05-27 格式:DOC 页数:17 大小:72KB
下载 相关 举报
服务器维修维护案例.doc_第1页
第1页 / 共17页
服务器维修维护案例.doc_第2页
第2页 / 共17页
服务器维修维护案例.doc_第3页
第3页 / 共17页
服务器维修维护案例.doc_第4页
第4页 / 共17页
服务器维修维护案例.doc_第5页
第5页 / 共17页
点击查看更多>>
资源描述

1、ibm 服务器 225 不能正常启动 软件公司的一名软件实施人员.在给客户安装 ibm 服务器的时候。用 sever guite 装的系统2003。一切都正常。但过了一短时间客户一直没用那个服务器。现在服务器出现这样的情况,即开机了之后能进入系统,但显示器不亮。机子一直在转,但显示器不能显示。 (试过很多显示器问题依旧)故障:内存没有插紧。IBM X_206 的服务器不能正常启动 电脑运行时 正确的选择重启,启动到一半就象断电一样关机。按开关启动,重复 N 多次仍然不能启动(到不了操作系统界面) 。过段时间了又能启动起来。如果电源有问题,应该不可能启动起来的。如果是风扇散热不好的话不可能一直开

2、很多天不关也不死机或重启啊!应该也不是 ADP3421(内置显卡) 的问题吧?故障:是 ADP3421 的问题IBM 235 两个硬盘亮红灯 基本情况:IBM X235 服务器 两个硬盘亮红灯客户要求:更换 3 个硬盘 重新做 RAID5处理过程:1.更换 3 个硬盘,做 RAID5 安装 WINDOWS 2000 SERVER 英文操作系统2.装好后,清理灰尘。再开机,自检不通过,开机不能进系统了 3.头都大了,重新检查连接线路等,重新开机终于恢复正常总结教训:不是特殊情况,不要满足客户要求,而贸然清洁灰尘。HP 370G1 加装阵列卡 基本情况:一台 N 年前的 HP 370G1 要装几个

3、硬盘做 RAID5 安装邮件系统,客户肯定说标机带 RAID5 功能,经过多次尝试:第一,找不到配置 RAID5 的地方,第二也没有光盘能够配置。最后否定客户的理论,额外增加一个阵列卡,搞定。基本配置:HP 370G1 642 阵列卡 CTRM+M RAID5 REDHAT5.5总结教训:不得完全相信客户的说法,有的时候客户并不清楚。专业服务器维保维修维护升级技术支持服务(IBM,HP,DELL)及阵列 RAID 数据恢复及存储的安装,调试。我有多年(年以上)服务器维保维修维护升级技术支持服务工作经验,对各种品牌的服务器的架构、原理了若指掌,判断故障迅速、准确:同时我有业内多种服务器配件的信息

4、资源,这些可以充分保障以最短的时间、最准确的判断为您迅速解决服务器故障:熟悉 Windows Linux 操作系统,熟悉存储,熟悉双机热备安装调试。对 Linux 、AIX 系统也有一定研究,承接服务器 IT 外包服务,包括服务器(IBM,HP,DELL)及存储(DS4700,DS4800,DS5020,DS3400,DS3200)的安装,调试,维修,检测,故障诊断, 抢修,出具详细的检查报告,定期预防性的维护和检查,设备巡检,服务器维修,服务器抢修, 阵列 RAID数据恢复等服务. IBM 服务器维保 |IBM 服务器维修维护升级技术支持服务|北京服务器维修维护升级技术支持服务DELL 服务

5、器维保 |DELL 服务器维修维护升级技术支持服务|北京服务器维修维护升级技术支持服务HP 服务器维保|HP 服务器维修维护升级技术支持服务|北京服务器维修维护升级技术支持服务服务器硬件维护服务对系统错误进行分析,及时进行现场维修、更换;对系统板卡、设备的微代码进行升级,采取系统检测判断;对设备实行定期预防性维护;提供设备维护、维修记录和报告;辅导掌握系统的基本操作,并给予技术支持;为您提供技术培训和经验传授。服务器系统软件维护服务提供系统软件操作方面的 24 小时电话支持;提供系统维护、调整及安全性设置等方面的技术支持;对系统软件的错误进行记录、分析,为操作系统作故障诊断;实施系统增强和修补

6、程序的分发、安装和测试;辅导掌握系统软件的基本操作,并给予技术支持;对系统软件运行实施定期预防性的维护和检查;提供系统优化和性能调整;提供设备维护、维修记录和报告。服务器维修项目:服务器内部除尘服务服务器搬迁服务服务器全面检测、故障诊断服务器系统安装及服务器安装部署服务服务器升级服务,扩充硬盘、内存、CPU、冗余电源、提供升级方案:服务器冗余电源更换;服务器内存更换;服务器 VRM 模块更换;服务器风扇更换;服务器硬盘更换;服务器数据恢复、磁盘阵列(RAID)数据恢复;服务器主板及其他硬件 BIOS、Fireware 升级;提供北京及北京周边地区 pc 服务器厂家保修外的第三方优质维修服务。维

7、修 IBM 服务器(所有型号) 、DELL 服务器(所有型号) 、HP 服务器(所有型号) 、联想服务器(所有型号) 、浪潮服务器(所有型号)及 INTEL、AMD 架构的兼容服务器等等。IBM 服务器维保维修维护升级技术支持服务DELL 服务器维保维修维护升级技术支持服务HP 服务器维保维修维护升级技术支持服务联想服务器维保维修维护升级技术支持服务浪潮服务器维保维修维护升级技术支持服务INTEL、 AMD 架构的兼容服务器维保维修维护升级技术支持服务电话:13810829916 麦子(北京地区)MAIL:ibm-网络管理员的工作往往是诊断和解决服务器各种各样的故障。虽然说没有人喜欢麻烦,但麻

8、烦总是自己找上门来。只有拥有高超的诊断技能,你才能在紧急情况下迅速响应,保障网络流畅地运行。当你面临网络故障的挑战时,首先向自己问几个简单的问题:有哪些地方被改变了?这个问题以前遇到过吗?如果是,是什么时候?是否有可能让问题再次出现?用户做了什么特别的操作吗?其他用户有没有遇到过同样的问题?为什么开机自检无法通过?解决方法:1)机器切断电源,将机箱打开,用 COMSCLEAR 跳线的跳线帽将 COMSCLEAR 跳线的另外两个针短接(跳线参看主板说明书) ;2)机器加电,自检,等机器自检完毕,报 CMOS 已被清除,然后将机器电源关掉,把跳线复原即可;3)机器重新开机。机器开机常见问题处理解决

9、方法:1、装完系统后,显示器出现花屏现象,系 AGP 显卡故障。更换后一切正常。2、开机黑屏,不自检,并且报两声嘟声,系内存未插紧。重插内存,故障解决。3、开机散热风扇不转,而机箱后侧风扇却转(说明主板已上电) ,系 CPU 散热风扇电源线插错(插到机箱风扇电源接口) ,插到 RIMM1,侧面的 CPU 风扇接口后故障解决。对于 NAS 系统维护有哪些解决办法?解决方法:由于 NAS4100/4300 操作系统有镜像备份,一般的系统损坏可以通过备份的操作系统进行启动。本次的维修步骤含以下的情况:硬盘发生问题操作系统及备份系统均破坏步骤如下:1.选择相同机型的备件,由于 NAS4100/4300

10、 有 4 块硬盘,所以建议选取用户发生问题的同等硬盘2.将硬盘上的数据区删除,即将硬盘接到 PC 上,单独的将数据区删除;上述步骤不可在NAS 上进行3.将好的硬盘替换到有问题的 NAS 上4.启动 NAS,如果更换的硬盘涉及系统启动,需要在 NAS 接上键盘和显示器,在 NAS 的启动中更改 CMOS 的启动顺序5.开启 NAS 的管理界面进入 TerminalAdvancedService 的管理界面6.在 Win2000 系统的磁盘管理选项中,进行对系统区及数据区的恢复对于系统区的恢复工作主要是重新建立系统的镜像保护,选择系统区的硬盘点击鼠标右键,选择重新建立镜像对于数据区的恢复工作主要

11、是重新建立系统的 RAID5 数据保护,由于 NAS 的 RAID5 数据保护,故原先系统如果发生问题,更换一颗硬盘重新建立 RAID5 即可。方法如下:选择数据区的硬盘点击鼠标右键,选择修复 RAID5 重新建立7.在系统区和数据区恢复过程中,请等待整个过程的结束,因为此时可能会发生影响,如果此时中断的话,可能会引起数据丢失。对于数据区的恢复过程时间可能会长达 5 小时,视数据区资料量而定。注意事项:针对系统区的硬盘更换,一一对应的更换很重要,可减少数据丢失及不稳定情况的发生,减少维护的工作量如果重新建立 RAID5 区,更换的硬盘此区必须删除,否则无法重新建立Windows 服务不能启动解

12、决方法:在一台 windows2000 服务器上,部分服务设置成不用本地的系统帐户启动。一次重新启动Windows2000 服务器之后,发现这些服务没有启动,必须手工打开服务,重新输入密码,然后启动服务。每次重新输入密码,都收到消息说:已被授予作为服务登录的权限。要解决该故障,首先回答下面几个问题:哪些地方改变了?是否有人修改了服务器?这个服务以前能够启动吗?用户名称和密码正确吗?查询修改记录发现,该服务器是一个 DC,不久之前还是域控制器组织单元(OU,OrganizationalUnit)的成员。在移出该 OU 之前,这些服务一直能够顺利启动。另外,用来启动这些服务的用户名称和密码都是合法

13、的。进一步研究发现,域控制器 OU 的成员有一些特殊的权限,其中包括作为服务登录的权限。当出现问题的服务器移出该 OU时,服务器失去了那些权限。现在要做的是恢复服务器的权限。要将权限授予服务器,请按照如下步骤操作:在管理控制台(MMC)中打开活动目录用户和计算机管理单元,再打开域控制器 OU 的“属性”对话框。在组策略页中,点击“默认域控制器策略”,然后点击“ 编辑 ”,打开组策略管理器。依次扩展计算机配置/Windows 设置/ 安全设置,再扩展“本地策略”,然后点击“用户权利指派”。在右边的窗格中,右击“作为服务登录”,选择菜单“ 安全” 。把用来启动服务的用户帐户加入到策略,完成后点击“

14、确定”。服务器常见问题五:在服务器上使用的 SCSI 硬盘,为什么硬盘的 ID 号不能设置为 7?SCSI 控制器中,默认将 ID=7 设置为硬盘控制器占,所以硬盘的 ID 号不能设置为 7服务器常见故障十二、为什么开机自检无法通过?解决方法:机器切断电源,将机箱打开,用“COMSCLEAR”跳线的跳线帽将“COMSCLEAR”跳线的另外两个针短接(跳线参看主板说明书 )机器加电,自检,等机器自检完闭,报 CMOS 已被清除,然后将机器电源关掉,把跳线复原即可机器重新开机。服务器在应用中的核心地位,相信能到服务器频道来游玩的朋友,应该都了解的非常透彻了。那么,对于服务器的养护大家又知道多少呢?

15、在此,笔者将把自己了解的一些东西展示给大家,一是希望给大家作一个基础的参考,二是企盼能够引起大家对于服务器养护的意识。服务器养护绝技 1、电力控制一部服务器虽然比不上电磁炉的凶猛,但相对普通 PC 机的柔弱,它还是一个重量级的用电大户的。服务器硬件应用最基本的要点的就是要实现运行的稳定性与持续性,而要保持硬件系统的运行稳定,电力稳定是基础。这样,我们在布置机房内部的电力系统时,除了服务器机房市电的足够供应外,还要配备能够应付突发停电事故的现象。假定一个机房放置了 100 部平均额定功率为 500 瓦的服务器,那么配备一部安置 96 块UPS 专用高规格电池的大型 UPS 配电柜,基本可以保障市

16、电停止后,机器照常运转 8 小时(理想状态,实际应用中是 6.5 小时左右) 。服务器养护绝技 2、温度控制市面上绝大多数品牌的服务器运行时,如果没有其他控制设备,CPU 的平均温度都在 60o C 以上,箱体内部温度也都在 40o C 以上,而等到了并发处理繁忙的时候,上面两个标度都可能有 1020o C 左右的提升,这跟说明书上的理论说明可是相差了不少。如果服务器照着并发繁忙时的温度持续运行一个小时,谁能知道接着会发生什么样的事情?所以,当我们构建服务器运行环境时,一定不可以忘记的就是要实行温度控制。那么,我们怎么建立起温度控制的环境呢?利用空调系统!如果是一个放置大量服务器的 IDC 或

17、者 ISP 机房,一定要设置好一至二部可以保障日常温度控制所需的主用大匹量中央空调,另外准备一至二部同规格的备用;如果是一个放置十部以下数目的空调,至少要准备总体马力 3 匹以上的立式或室外壁式空调(不要使用室内壁式,以免空调漏水产生严重后果) ,把机房温度控制在 15-23o C 以内。此外,如果是大型机房,最好配备温度感应器进行监测。服务器养护绝技 3、湿度控制服务器周边环境的湿度控制也是非常重要的。假定服务器放在一个比较干燥的环境里照常运行,这样在周围特别是金属器械周围进行接触和摩擦时,很容易就产生静电。静电对于服务器的影响相信大家都比较清楚了,万一不慎,很容易造成电流击穿电容或者 CP

18、U 等重要部件,引起的后果不仅是系统的崩溃,对于操作人员的人身安全也有极大的威胁。我国的地理条件是南潮北干。在北方的机房,我们尽量在机房内放置一个加湿器;在南方,特别是在一楼的机房,在大型机房在地板下铺设防潮材料外,我们最好还要放置一些石灰沙包等吸水的基础设施,防止机房过于潮湿。南北方机房内湿度都应当控制在 4555%之间。此外,在下雨天,小型机房的窗子最好不要开启,避免雨水进入屋内,引起机房这个电力设施密部的环境产生不必要的触电危险。服务器养护绝技 4、火险控制可能很多人觉得火险控制是个无关紧要的事情,因为机房里很多设施都是绝缘材料做成的。但实际上,曾经发生的机房火光事故也不少了。插线板一定

19、要选择比较正规、安全可靠的那些牌子,饮水机旁边最好不要放置测试用的插线板,电镀、焊锡工作一定要小心,烟瘾比较大的同好最好到楼下解决需要。当然,人为因素解决以后,还要应付突发的不可知的环境因素,没有安装烟感器的楼宇最好自己准备一个独立的报警装置。服务器养护绝技 5、雷击避免电子设备对于雷电的感应是很灵敏的,稍不注意,可能就会发生危险了。很多楼房对于防雷设施都没有太多注意,机房如果在没有放置避雷针的楼里,可以的话,最好协调物业在楼房顶层把避雷设备给装上,将侵袭的雷电导引至大地。另外就是采用防雷击和浪涌的 UPS 设备。一、显示:“C:Drive Failure Run Setup Utility,

20、Press(F1)To Resume”此类故障是硬盘参数设置不正确所以从软盘引导硬盘可用,只要重新设置 硬盘参数即可。二、显示:“No ROM Basic,System Halted”病因分析:造成该故障的原因一般是引导程序损坏或被病毒感染,或是分区表中无自举标志,或是结束标志 55AAH 被改写。治疗方法:从软盘启动,执行命令“FDISK/MBR“即可。FDISK 中包含有主引导程序代码和结束标志 55AAH,用上述命令可使 FDISK 中正确的主引导程序和结束标志覆盖硬盘上的主引导程序,这一招对于修复主引导程序和结束标志 55AAH 损坏既快又灵。对于分区表中无自举标志的故障,可用 NDD

21、 迅速恢复。三、显示“Error loading operating system”或“Missing operating system”病因分析:造成该故障的原因一般是 DOS 引导记录出现错误。DOS 引导记录位于逻辑 0 扇区,是由高级格式化命令 FORMAT 生成的。主引导程序在检查分区表正确之后,根据分区表中指出的 DOS 分区的起始地址,读 DOS 引导记录,若连续读五次都失败,则给出“Error loading opearting system”的错误提示,若能正确读出 DOS 引导记录,主引导程序则会将 DOS 引导记录送入内存 0:7C00h 处,然后检查 DOS 引导记录的

22、最后两个字节是否为 55AAH,若不是这两个字节,则给出“Missing operation system”的提示。治疗方法:一般情况下用 NDD 修复即可。若不成功,只好用 FORMAT C:/S 命令重写DOS 引导记录,也许你会认为格式化后 C 盘数据将丢失,其实不必担心,数据仍然保存在硬盘上,格式化 C 盘后可用 NU8.0 中的 UNFORMAT 恢复。如果曾经用 DOS 命令中的 MIRROR 或 NU8.0 中的 IMAGE 程序给硬盘建立过 IMAGE 镜像文件,硬盘可完全恢复,否则硬盘根目录下的文件全部丢失,根目录下的第一级子目录名被更名为DIR0、DIR1、 DIR2,但一

23、级子目录下的文件及其下级子目录完好无损,至于根目录下丢失的文件,你可用 NU8.0 中的 UNERASE 再去恢复即可。四、显示:“Invalid Drive Specification”治疗方法:1、重新分区格式化2、如 0 磁道损坏需要低级格式化,然后用 Set Comspec(指定 Command 文件位置) ,使得 Command 远离 0 磁道。当硬盘出现分区故障后,希望用户先用上述方法解决,若不成功,对硬盘分区格式化是解决软故障的基本方法,但信息将被清除。其使用原则是:能用高格解决的不用分区,能用分区解决的不用低级格式化。五、显示:“Device error”,然后又显示:“Non

24、System disk or disk error,Replace and strike any key when ready”,说明硬盘不能启动,用软盘启动后,在 A:后键入 C:,屏幕显示:“Invalid drive specification“,系统不认硬盘。病因分析:造成该故障的原因一般是 CMOS 中的硬盘设置参数丢失或硬盘类型设置错误造成的。治疗方法:进入 CMOS,检查硬盘设置参数是否丢失或硬盘类型设置是否错误,如果确是该种故障,只需将硬盘设置参数恢复或修改过来即可,如果忘了硬盘参数不会修改,也可用备份过的 CMOS 信息进行恢复,如果你没有备份 CMOS 信息,也别急,有些高

25、档微机的 CMOS 设置中有“HDD Auto Detection”(硬盘自动检测)选项,可自动检测出硬盘类型参数。若无此项,只好打开机箱,查看硬盘表面标签上的硬盘参数,照此修改即可。六、显示:“HDD Controller Failure”病因分析:造成该故障的原因一般是硬盘线接口接触不良或接线错误。治疗方法:先检查硬盘电源线与硬盘的连接,再检查硬盘数据信号线与多功能卡或硬盘的连接,如果连接松动或连线接反都会有上述提示,最好是能找一台型号相同且使用正常的微机,可以对比线缆的连接,若线缆接反则一目了然。七、显示:“Invalid partition table” ,硬盘不能启动,若从软盘启动则

26、认 C 盘。病因分析:造成该故障的原因一般是硬盘主引导记录中的分区表有错误,当指定了多个自举分区(只能有一个自举分区 )或病毒占用了分区表时,将有上述提示。主引导记录(MBR)位于 0 磁头/0 柱面/1 扇区,由 FDISK.EXE 对硬盘分区时生成。MBR 包括主引导程序、分区表和结束标志 55AAH 三部分,共占一个扇区。主引导程序中含有检查硬盘分区表的程序代码和出错信息、出错处理等内容。当硬盘启动时,主引导程序将检查分区表中的自举标志。若某个分区为可自举分区,则有分区标志 80H,否则为00H,系统规定只能有一个分区为自举分区,若分区表中含有多个自举标志时,主引导程序会给出“Inval

27、id partion table“的错误提示。治疗方法:最简单的解决方法是用 NDD 修复,它将检查分区表中的错误,若发现错误,将会询问你是否愿意修改,你只要不断地回答 YES 即可修正错误,或者用备份过的分区表覆盖它也行(KV300,NU8.0 中的 RESCUE 都具有备份与恢复分区表的功能 )。如果是病毒感染了分区表,格式化是解决不了问题的,可先用杀毒软件杀毒,再用NDD 进行修复。如果上述方法都不能解决,还有一招,就是先用 FDISK 重新分区,但分区大小必须和原来的分区一样,这一点尤为重要,分区后不要进行高级格式化,然后用 NDD 进行修复。修复后的硬盘不但能启动,而且硬盘上的信息也

28、不会丢失。其实用 Fdisk 分区,相当于用正确的分区表覆盖原来的分区表。尤其当用软盘启动后不认硬盘时,这一招特灵。服务器作为企业内部数据存储和运行的主要手段,为企业信息化管理提供了更为可靠的海量信息存储、高效后台运行等优势,而要保障服务器正常运行,首先必须保障服务器存储安全,可无论企业如何“费尽心思”,在现实应用过程中,也很难完全保证服务器不发生任何数据丢失故障刀片式服务器易发生各种数据丢失故障近日,云南电网公司在运行服务器时,突然发生服务器中断现象,一时间整个服务器系统陷入瘫痪状态,且无法进行任何日常访问操作。故障发生后,该公司内部技术人员迅速对服务器进行了检测,并发现该服务器中的阵列出现

29、了严重故障,其中一块硬盘出现故障告警。虽然找到了故障所在,但由于服务器内存有企业重要资料,对于并不精通 RIAD 阵列数据恢复技术的人员来说,要进行任何操作都是危险的,一不小心还有可能造成永久*器数据丢失。这时,公司想到了服务器及软件经销商,但经该服务器经销商所派技术人员尝试,仍对此 RAID 阵列数据恢复技术“无能为力” ,并建议云南电网公司寻求专业 RAID 阵列数据恢复机构的帮助,经介绍,该公司两名技术人员随即带着故障服务器来到昆明专业数据恢复机构效率源昆明数据恢复中心。服务器 RAID 阵列数据恢复要求技术人员具有丰富的 RAID 阵列数据恢复实战经验在得知该服务器可能为阵列故障后,已

30、有 7 年 RAID 阵列数据恢复经验的昆明数据恢复中心总工程师杜鹏斌接下此次 RAID 阵列数据恢复业务,并亲自上阵 “操刀”。经进一步检测确认,该服务器为 IBM 刀片式服务器,共有 2 块 146G 的 2.5 寸 SAS 硬盘,属 Raid0 阵列类型,两块 SAS 硬盘中有一块硬盘存在较为严重的物理坏道,需要工程师进行 RAID 阵列数据恢复,并找出近 30G 的 oracle 数据库文件,难度可见一斑!为确保数据安全,善于处理各种 RAID 阵列故障数据丢失问题的杜鹏斌,首先利用专业数据恢复设备Data Compass 对硬件故障盘进行了坏道强力复制,并快速得到镜像文件。接着,使用

31、 Data Compass 的 RAID 阵列数据恢复功能分析 RAID 的盘序、块大小等参数,然后重组 RAID 数据。在这当中,客户的 D 盘为 oracle 数据库的运行分区, E 盘为数据库备份分区。先用 Data Compass 恢复 E 盘的数据库备份文件,但通过备份出的日志可以看出,最近两个多月的备份都没有成功完成,所以这些备份文件属无效文件。针对各种 RAID 阵列数据恢复具有突出表现的专业数据恢复设备既然无法从 E 盘中得到有效数据,杜鹏斌认为会不会是由于 D 盘数据库文件所在区域有坏道所导致?“而此时,唯一的希望就是恢复 D 盘上的数据库文件了。 ”经过近两个小时的特殊算法

32、判断,他果然在 oracle 数据库 DATA 目录下的一个 14G 的 SYSTEM01.DBF 系统表文件上发现了几百个坏扇区, “这是一个关键性的文件,如果损坏,数据库便无法恢复及正常使用”杜鹏斌说。找到此次 RAID 阵列数据恢复“ 要害”后,通过 Data Compass 强大的坏道读取技术,不仅成功将 SYSTEM01.DBF 系统表文件修复,而且数据库也恢复了正常使用。小结:案例中,云南电网公司服务器故障可能来自两方面原因,一是服务器的数据访问更新负荷较重,二是采用了安全性较差的 RAID0 阵列,故该服务器面临着比其他类型服务器更大的安全问题。当然,在如今复杂的网络环境下,除具

33、备服务器数据保护技术和较高性能的服务器设备外,事发后选择一家安全、有效的数据恢复机构也是规避单位服务器数据丢失的有利措施!关于效率源效率源科技是从事计算机存储信息安全、数据恢复、计算机取证工具研发生产的国家级高新技术企业、双软认证企业。自建有占地 4000 平米的研发生产销售基地,公司总资产达5000 万元,效率源共有员工 80 余人,其中研发技术支持占 70%以上,是数据恢复研发领域的巨无霸,等同于微软在操作系统的绝对领先地位。效率源科技一直致力于自主研发信息安全数据恢复软件及硬件工具并拥有全自主知识产权,生产的信息安全数据恢复工具引领了数据恢复行业的未来技术走向,在全球数据恢复行业具有绝对

34、竞争力,并成功销往全球 120 多个国家近 5000 余家专业数据恢复机构,2010 年预计年销售额达 4000 万人民币,出口创汇 3000 万人民币。同时中国本土 90%以上的专业数据恢复服务公司也选用了效率源科技的数据恢复工具,此外司法部门、部队、企事业单位等行业客户也将效率源专业级数据恢复软件工具 和司法鉴定计算机取证软件工具作为标配工具设备,在数据恢复业界具有极高的声誉和影响力。效率源科技产品咨询热线:02868376816 400-656-2009WEB 服务器选购的文章,希望对你能有点用处 说到服务器,目前最热门的应用无非就是做 Web 支持和网游平台,国内大部分采购服务器作为网

35、游应用的都是私服,属于侵犯知识产权的行为,虽然短期内容易盈 利,但是是违法的,国内已经有架设私服被判刑的先例,所以不便多做讨论,今天想就我个人这几年架设WEB 服务器的经验跟大家谈谈 WEB 服务器和服务器硬件 方面的搭配问题。 很多中小型企业的技术人员或者打算以网站、盈利的个人团体组织都经常提出这么一个疑问:究竟什么样的配置可以支持多大的流量 ?其实这个问题不可能有准确答案,因为每个网站使用的 Web 系统都不一样,有些喜欢用 IIS+ASP,有些则是用 Apache+PHP,这在脚本的执行 效率上本身就存在很大的差异,另外,网页系统编写的复杂程度和优化程度也极大的影响着服务器能够承载的访问

36、人数,大部分的新闻资讯、下载类网站都已经使用 了静态页面来减少 Web 系统对服务器处理能力的依赖,但是仍然有不少例如论坛、商城一类的系统需要大量动态代码的支持,所以笼统的去谈论一个服务器能够支 持多少访问量是没有实际意义的,还是需要具体的去分析:首先说说 CPU,我们知道,大部分的 Web 脚本为了安全起见都是在服务器端执行的(Javascript 例外) ,而这些脚本就相当于我们用 VB 或者 C +编程时使用的高级语言,不同的是我们用 VB 这些软件编程,编辑软件最后会把我们的代码编译成执行效率更高的可执行软件,而我们的 Web 脚本在保存时是 不会被编译的,都是在用户请求访问这个页面时

37、才被相关的编译器进行编译操作,这样一来,结果就是一个页面被访问 N 次,就得被编译N 次,这样对系统资源的占 用是非常可怕的,虽然 IIS 已经对.NET 进行优化,会将被访问过的页面编译后缓存起来,下次其他用户进行相同请求时不再需要对这个页面进行编译,但网页 脚本的复杂性和庞大性最终还是大量的占用系统资源尤其是处理器资源,这就是为什么热门论坛同时多人在线服务器会变得很慢。其实现在的服务器配置,大多是 P4 3.2G或者双路 Xeon 3.0G,这样的配置对于动态论坛这种极度消耗资源的系统仍然没有足够的支持能力,根据我的经验,一个服务器上如果是纯粹一个动态论坛而没有其他应用,采 用 P4 的处

38、理器大概也就同时支持 200-300 人在线,如果是 Web 系统效率较高,脚本优化得好,还可以再多 100200 人,如果是双路 Xeon,千人在线也 差不多是极限了。所以,到目前位置,如果想做访问量、想做人气,选用性能比较强劲的 CPU 还是有足够理由的,个人比较推崇的还是采用 Xeon 系统,P4 毕竟是入门级的配置,虽然双核 P4D 性能已经比以前大幅提升,但在多任务处理中,双路 Xeon 的表现还是遥遥领先,而且对于多客户访问的支持也更加稳定。当然,有人可能会问:如果是静态页面为主的站点,是不是对处理器的要求就比较低了?答案是肯定的。静态页面不需要经过编译,基本就看网络带宽和网卡,

39、如果是图片多的网站,硬盘最好也换成 SCSI,高转速高缓存的 SCSI 硬盘对于多而小的文件读取更有优势,而且稳定性更好,寿命也更长。接下来说说内存,不管是静态页面的网址还是动态页面的网站,最好都尽量使用大容量内存,尤其是现在的服务器,内存的运行速度已经不是什么重要问题, DDR 333、DDR 400 或者 DDR2 其实区别都不大,最重要的只有两点:内存的容量和纠错(如 ECC)。由于服务器有大量的数据需要临时缓存到内存里,所以访问量大的时候内存的占用也是较大 的,而当内存不够用的时候,虚拟内存的工作压力就非常大,其实就是磁盘工作压力会很大,而系统程序跟数据缓存操作不断的争抢内存资源时,当

40、机的几率就高了 很多,如果你不希望你的服务器经常重启,配置大容量内存是非常必要的,除非是一天千位数 IP 的那种小型网站,不然还是建议大家使用 1GB 以上内存,即使有时候内存的使用率不会想我们想象的那么高,但是使用大内存对于降低虚拟内存的使用和减少重启次数都是有很大帮助的。而内存的纠错其实在服 务器上是非常必要的,首先很多服务器主板本身就要求搭配 ECC REG 内存,普通内存根本开不了机,另外,由于内存也是高速设备而且数据刷新频率非常高,所以加入纠错芯片的 ECC 内存可以有效的帮助系统减少由于数据信 息出错而产生的严重后果,另外,由于内存的校验操作都是内存上的独立智检芯片完成,所以不会占

41、用CPU 资源,一些用户担心内存纠错会造成系统性能的下降其 实是一种心理作用。至于服务器的硬盘,现在大部分的入门级机型都使用性能出色价格低廉的 SATA 硬盘,其实这也无可厚非,只不过如果严格比较 SATA 跟 SCSI 的区别, 在稳定性方面和使用寿命方面 SCSI 还是有较大优势。我们知道,现在凭借较大的单碟容量, SATA 硬盘的性能已经可以跟 SCSI 媲美,但是服务器这种分分 钟要接受用户访问,不断读取、改写磁盘数据的应用环境还是给硬盘带来很大的工作压力,尤其是多人访问以及长时间下载的时候,这样的高强度读写量绝对是桌面 级的硬盘无法承受的,哪怕是 SATA 硬盘,也只是在接口上做了调

42、整,磁盘体和磁头的发热仍然会造成致命伤,而 SCSI 硬盘设计的时候就考虑到它的工作环 境,所以不会一味扩充容量,而是以安全为先决条件,这就是为什么很多二手市场淘汰下来的 SCSI 硬盘都仍然可以再用个几年。所以,做下载的站点如果资金允 许,还是应该尽量选用 SCSI 硬盘,如果用 SATA,也应该定期检查服务器磁盘是否报错以便及时处理减少损失,这绝不是危言耸听,我做过的几个带有资源下 载的站点,SATA 硬盘基本都是 1 年左右就开始报错了。再说说主板吧,一些初级用户觉得用家用主板可以很好的节省成本,其实家用主板跟服务器主板根本就是两回事,为什么“泰安”和“ 超微”的主板会那么贵? 并不是没

43、有道理的:首先是稳定。做服务器的,如果不稳定,一切性能都是空谈。服务器主板的内部总线在设计上要优于家用板,总线带宽够大,能够同时传输的数 据才多;另外,服务器主板的用料也非常严格,电容、电阻偷工减料的行为在服务器主板上是不能出现的,还有就是设计问题了,有能力做服务器主板的厂家,设计 产品的功力自然要高出一筹,电路设计的合理和优化也是影响主板稳定性的一个因素。最明显的一点:在访问量大的时候,如果是普通主板,不是卡的非常厉害就是 立刻罢工,而服务器主板则可以比较平稳的处理这些任务。另外,服务器主板上都会集成一张 ATI 的入门级显卡,一般是 8M 显存,显存也是直接集成主板上,为 什么这样?因为对

44、服务器来说,显卡是个负担,只有在安装调试的时候才用到,其他时候服务器扔在机柜里面都是不接显示器的,全部通过远程管理,服务器最好没 有显卡,因为多一个显卡就多一个负担,需要 CPU 建立联系处理数据,而且服务器不能集成太强大的显卡,因为性能好的显卡还会发热、耗电,所以专业的服务器 主板都是内建一张 ATI入门级显卡。最后说说网卡。既然是服务器,肯定都是要接入网络来工作,而服务器访问量一般都很大,这时候专业网卡跟普通网卡的区别就非常明显!例如我们常用的 30 元一块的普通10/100M 网卡,或者是大多数主板集成的网卡,当然现在也有不少千兆的网卡卖到这个价或者集成在主板上,但是,这些都是个人上网使

45、用的, 用了这样的网卡,服务器根本顶不住几百个人在线,因为网卡的线程到了极限,完全依赖 CPU 的处理,同时这些网卡用料比较省,寿命也不长,像服务器这样长时 间工作,这种网卡是最先挂掉的,我以前就见过有人在服务器上使用这种网卡最后网卡烧掉的。另外也有一些好一点的网卡,价格在 60-180之间,其实这些也 不行,因为线程不存在瓶颈的时候吞吐量已经到了极限,大家不要简单的把吞吐量看成是数据流量,而是数据零碎的处理速度,举例来说,一个大力士一次搬动 100KG 的东西,你搬 10KG 的,但是你速度快,你能搬的速度比他快 10 倍,那你说是你比较效率高。其实错了,因为你搬起和放下比他多 9 次,而且

46、每次你 都用脑子去记录,他可以完全不动脑子,而脑子就是 CPU。服务器必须使用专业网卡,例如 3com、intel 的,这些网卡单独出售价格都在几百到几千元, 不过服务器主板上一般都会集成有,这类网卡才是最适用的,因为基本不依赖 CPU,能直接和内存沟通数据,有自己的很大的缓存区,甚至有的能直接分离垃圾数 据请求。我们个人平时使用,其实任何网卡都是一样,不过拿到服务器上,好的网卡和差的网卡,立刻分出区别。说了这些,其实还是希望大家对服务器各个配件有一些了解,特别是现在很多人选择组装的方式构建服务器,就更应该用稳定和适用去衡量产品,而不要一味降低成本,结果弄出一台服务器拿到机房经常死机,后期维护

47、起来让自己头疼。服务器 CPU 利用率 100%的常见解决方法 1、 dllhost 进程造成 CPU 使用率占用 100% 特征:服务器正常 CPU 消耗应该在 75%以下,而且 CPU 消耗应该是上下起伏的。出现这种问题的服务器,CPU 会突然一直处 100%的水平,而且不会下降。查看任务管理器,可以发现是 DLLHOST.EXE 消耗了所有的 CPU 空闲时间,管理员在这种情况下,只好重新启动 IIS 服务,奇怪的是,重新启动 IIS 服务后一切正常,但可能过了一段时间后,问题又再次出现了。 直接原因: 有一个或多个 ACCESS 数据库在多次读写过程中损坏,微软的 MDAC 系统在写入

48、这个损坏的 ACCESS 文件时,ASP 线程处于 BLOCK 状态,结果其它线程只能等待,IIS被死锁了,全部的 CPU 时间都消耗在 DLLHOST 中。 解决办法: 安装“一流信息监控拦截系统”,使用其中的“ 首席文件检查官 IIS 健康检查官”软件, 启用”查找死锁模块” ,设置: -wblock=yes 监控的目录,请指定您的主机的文件所在目录: -wblockdir=d:test 监控生成的日志的文件保存位置在安装目录的 log 目录中,文件名为:logblock.htm 停止 IIS,再启动“首席文件检查官 IIS 健康检查官” ,再启动 IIS, “首席文件检查官 IIS健康检

49、查官”会在 logblock.htm 中记录下最后写入的 ACCESS 文件的。 过了一段时间后,当问题出来时,例如 CPU 会再次一直处 100%的水平,可以停止IIS,检查 logblock.htm 所记录的最后的十个文件,注意,最有问题的往往是计数器类的 ACCESS 文件,例如:”*COUNT. MDB ”, ”*COUNT.ASP”,可以先把最后十个文件或有所怀疑的文件删除到回收站中,再启动 IIS,看看问题是否再次出现。我们相信,经过仔细的查找后,您肯定可以找到这个让您操心了一段时间的文件的。 找到这个文件后,可以删除它,或下载下来,用 ACCESS2000 修复它,问题就解决了。2、 svchost.exe 造成 CPU 使用率占用 100% 在 win.ini 文件中,在Windows下面, “run=”和“load=”是可能加载“木马”程序的途径,必须仔细留心它们。一般情况下,它们的等号后面什幺都没有,如果发现后面跟有路径与文件名不是你熟悉的启动文件,你的计算机就可能中上“木马”了。当然你也得看清楚,因为好多“木马” ,如“AOL Trojan 木马”,它把自身伪装成 command.exe 文件,如果不注意可能不会发现它不是真正的系统启动文件。 在 system.ini 文件中,在

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报