1、精品文档XXXX琉统-故障报告单故障发现人通知时间2010-8-10 08:45故障受理人故障处理人起始时间08:45终止时间10:10持续时长两个小时地点故障所属系统故障等级严重故障现象系统web服务down机,导致整个系统无法应用故障影响范围公司所有应用人员故障原因 分析8月10号上午,XXXXX源统TOMCAT勺服务DOWN,通过后台监控发现 该DOWN主要原因是由于煨新上线的 XXX模块的工单处理查询操作导致, 由 于界面查询提取SQL语句编写不够规范,导致每次该工单的应用占用耗费很 大资源,被同时多次使用后,资源被耗尽导致整个 WEESK务DOWN。处理结果1、优化该界面应用的查询S
2、QL语句。经验总结1、加强测试,上线前使用第三方压力测试软件进行压力测试,经监控后没有 BUG可题方可进行上线;2、必须严格要求上线前业务部门务必在测试机器上进行测试使用确认后方 可上线;3、增加数据库所有在数据量的士外长记录情况, 每月提取一次,进行每月定期, 根据实际生产情况提出优化方案(如有必要),增加系统自动监控脚本操 作,对系统运行进行监控,如有负裁超过 2以上的需要保留其数据库后台 运行SQL记录及访问界面功能菜单记录;4、规范上线时间,每周定时上线,上线前必须确保版本管理,务必记录好每 次上线的具体功能代码,确保有故障发生时能迅速定位。责任分析该故障为XXX冶司责任。备注填报人:填写时间:20102年08月14日 2欢迎下载