收藏 分享(赏)

数据库技术方案.doc

上传人:tangtianxu1 文档编号:2975651 上传时间:2018-10-01 格式:DOC 页数:16 大小:179.63KB
下载 相关 举报
数据库技术方案.doc_第1页
第1页 / 共16页
数据库技术方案.doc_第2页
第2页 / 共16页
数据库技术方案.doc_第3页
第3页 / 共16页
数据库技术方案.doc_第4页
第4页 / 共16页
数据库技术方案.doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

1、内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 1/16 页广西区质量技术监督局数据库维保服务方案南宁秦唐科技有限公司2016 年 8 月内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 2/16 页目录广西区质量技术监督局数据库 1维保服务方案 11 项目背景及目标 31.1 项目背景 31.2 项目目标 32 需求分析 33 维保范围 44 数据库维保方案 54.1 系统健康状态检查 54.1.1 Oracle 数据库运维主要核查项 54.1.2 Mysql 数据库运维主要检查项 .94.1.3 SqlServer 数据库运维主机检查项

2、 .104.2 数据库性能分析与优化调整 104.3 数据库备份以及恢复服务 114.4 数据库补丁分析与安装 124.5 7*24 小时数据库救援服务 .125 技术支持以及服务体系 135.1 故障处理要求 135.2 重大活动现场护航 135.3 维护作业计划 145.4 信息安全保障 145.5 第三方协助服务 145.6 服务质量分析 146 项目实施以及管理 156.1 项目实施策略 156.2 项目实施计划 156.3 项目交付文档 156.4 交付要求 156.5 提交文件资料 16内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 3/16 页1 项目

3、背景及目标1.1 项目背景广西区质量技术监督局信息化建设经过多年的发展和完善,已经建立成熟的网络环境及生产经营管理的各类应用系统,目前质监局拥有多套不同类型的数据库(多种操作系统)混合使用(Oracle,Mysql,SqlServer) ,共十几个节点,其中最大的 oracle 生产数据库已高达 3TB;随着质监工作的业务发展,各系统数据量逐年增加 ,作为业务核心的数据库,安全性,可靠性的要求也变得越来越高, 需要更加专业细致地对数据库维护,以便更好地为全区质监工作提供 IT 服务。1.2 项目目标通过建立规范的维护作业体系,及时发现数据库运行中的风险问题,防患于未然,保障数据库运行健康持续。

4、对数据库运行性能进行监测分析,及时发现瓶颈,通过外部资源调优、行的重新安排调优、SQL 性能调优、表格和索引存储参数设置调优等方式,及时对性能问题进行处理,保障数据库稳定高效工作;对各个系统数据库进行补丁升级服务,安装补丁前需要对补丁的可行性及风险性进行分析,并制定升级计划和应急回退计划。同时要做好系统备份准备及详细的测试工作,确保系统的稳定性、安全性,保障系统业务数据的安全;2 需求分析广西区质量技术监督局项目现场多种数据库共存,相互为多个应用系统服务。为保证数据库系统的稳定、安全、合理和高效,减低故障对生产的影响,消除生产故障的薄弱环节,现需购买对以下数据库的保修和维护服务。内部公开本文中

5、的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 4/16 页ID 数据库节点 数据库类型 应用说明 保障级别1 oracle rac 双节点(HP主机) oracle10g 金质工程核心数据库 重要2 oracle rac 双节点(Linux) oracle10g 金质工程核心数据库 重要3 Oracle 单节点 Oracle 10g 边界交换数据库 重要4 Oracle 单节点 Oracle 10g 云平台数据库(内网) 重要5 Oracle 单节点 Oracle 10g 云平台数据库(外网) 重要6 SQL SERVER MSCS1 mssql server2008 外部门户

6、数据库 重要7 SQL SERVER MSCS2 mssql server2008 外部门户数据库 重要8 SQL SERVER MSCS3 mssql server2008 OA 考核 重要10 SQL SERVER MSCS4 mssql server2008 重要11 mysql 集群 1 普通12 mysql 集群 2 普通3 维保范围 1) 提供常态化服务和技术支持,并配备资深工程师,工程师熟悉 oracle/sqlserver/mysql等各种主流数据库技术,保证能快速、有效的解决各类故障。 2) 配置和优化系统安全、加固,故障的诊断与排除等。3) 数据库系统恢复服务,确保系统崩溃

7、后的快速恢复。4) 为客户提供各个版本数据库系统运行和维护的合理建议。5) 数据库系统软件升级(用户要求)和不限次(或配合用户)安装。 6) 对数据库系统本身存在的安全隐患和安全问题,进行修复;对系统配置和数据定期备份7) 提供系统维修及维护报告。内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 5/16 页4 数据库维保方案数据库维保工作主要包括: 数据库健康状态检查、数据库性能分析与调整、数据库备份与恢复、数据库补丁分析与安装、7*24 小时数据库救援等工作。4.1系统健康状态检查检查内容包括 : Oracle 数据库和 CRS 错误日志和分析 ; 文件系统空间使

8、用情况检查; Oracle 数据库及 RAC 系统运行情况状态、性能分析和优化建议; 检查其 OS 状况,包括 CPU、内存和交换区使用情况,硬盘和网络的 IO 情况检查; 记录 Oracle 数据库存储空间的逻辑结构; Oracle 数据库备份情况检查;等根据检查结果分析并给出数据库可行的调整建议和实施;每月至少进行一次系统健康状态的检查, 根据制定的维保服务内容和流程对Oracle、Mysql,SqlServer 进行一次全面巡检,包括检查数据库设备、系统的运行情况 ; 每月 25日之前提供数据库巡检报告 。4.1.1 Oracle 数据库运维主要核查项数据库的运维主要结合广西质量技术监督

9、局的实际情况,提供切实可行的运维建设机制,内容覆盖 ORACLE 数据库的日常维护、紧急故障处理,软件升级等,客户可依据服务内容进行相应的定制。我们将会提供全面的、针对性的服务解决方案,以保客户系统稳定、高效、可靠的运行,以达到对业务系统的有效支持。4.1.1.1 检查数据库 cpu、I/O、内存性能记录数据库的cpu使用、IO 、内存等使用情况,使用vmstat,iostat,sar,top等命令进行信息收集并检查这些信息,判断资源使用情况。4.1.1.2 检查 rman 备份的有效性restore preview/restore database preview 命令内部公开本文中的所有信

10、息均为秦唐科技有限公司所有,未经许可不得向外传播。第 6/16 页此命令用来查看还原需要使用哪个备份集来执行特定的恢复使用 validate 和 check logical 参数的 restore 命令,检查备份集,以确认数据库是可恢复的restore database validate;使用 check logical 参数可以更完全的检查最新备份集runrestore database check logical validate;使用 validate backupset 命令使用具有 validate 参数或 check logical 参数的 restore 命令只能检查最新的备份集

11、,如果要检查任意的备份集,就需要用 validate backupset 命令。首先必须确认要检查的备份集的键(backup set key)list backupset;再执行检查validate backupset 141;或validate backupset 141 check logical;4.1.1.3 检查 oracle 数据库集群运行状况用 crs_statt 命令检查 oracle 数据库的几个集群模块是否有 offline 的4.1.1.4 检查数据库的 Alert.log 日志,是否有 ora 错误对每个数据库,cd 到 bdump 目录,通常是$ORACLE_BASE

12、/admin/bdump查看最新时候有 ora 错误,找出来分析4.1.1.5 收集每个数据库的 AWR 报告,根据报告内容,优化数据库排查是否存在影响系统性能的等待事件、top 5 SQL、硬解析是否太高、缓冲区命中率是否高4.1.1.6 检查 ASM 磁盘组空间是否足够select instance_name,host_name,startup_time,status,database_status from gv$instance;确保数据磁盘组有足够的空间给数据库使用,如果是用于归档日志用的 ASM 磁盘组空间满,必须及时用 rman 备份并删除旧的归档日志。4.1.1.7 检查各个数

13、据库操作系统的磁盘空间利用率dfh 或者 dfm文件系统空间使用率超过 80%,必须要清理磁盘无用的文件或者日志内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 7/16 页4.1.1.8 检查数据库各个节点都处于读写模式select name,log_mode,open_mode from gv$database;各个节点都正常,数据库才能实现负载均衡和失败切换的功能4.1.1.9 查看表空间使用率,及时添加数据文件SELECT UPPER(F.TABLESPACE_NAME) “表空间名“,D.TOT_GROOTTE_MB “表空间大小(M)“,D.TOT_GRO

14、OTTE_MB - F.TOTAL_BYTES “已使用空间(M)“,TO_CHAR(ROUND(D.TOT_GROOTTE_MB - F.TOTAL_BYTES) / D.TOT_GROOTTE_MB * 100,2),990.99) “使用比“,F.TOTAL_BYTES “空闲空间(M)“,F.MAX_BYTES “最大块(M)“FROM (SELECT TABLESPACE_NAME,ROUND(SUM(BYTES) / (1024 * 1024), 2) TOTAL_BYTES,ROUND(MAX(BYTES) / (1024 * 1024), 2) MAX_BYTESFROM SY

15、S.DBA_FREE_SPACEGROUP BY TABLESPACE_NAME) F,(SELECT DD.TABLESPACE_NAME,ROUND(SUM(DD.BYTES) / (1024 * 1024), 2) TOT_GROOTTE_MBFROM SYS.DBA_DATA_FILES DDGROUP BY DD.TABLESPACE_NAME) DWHERE D.TABLESPACE_NAME = F.TABLESPACE_NAMEORDER BY 4 DESC;密切关注各个表空间使用情况,使用率查过 85%以上的,要及时添加数据文件到表空间,并与上个月巡检结果对比,估算主要业务表

16、空间增长增长情况,一次性添加做过数据文件4.1.1.10 检查失效的索引Select * from dba_indexes where status=UNUSABLE;如果有失效索引,alter index index_name rebuild online 在线重建。内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 8/16 页4.1.1.11 检查大表,分析是否需要转换成分区表存放SELECT SEGMENT_NAME, ROUND(SUM(BYTES) / 1024 / 1024 / 1024, 2) GFROM DBA_SEGMENTSWHERE OWNER

17、NOT IN (SYS, SYSTEM)AND segment_type NOT IN(INDEX, INDEX PARTITION, INDEX SUBPARTITION)GROUP BY SEGMENT_NAMEORDER BY G DESC;对于日志大表,建议改造成采用按时间分区的分区表,提升数据库读写效率。4.1.1.12 检查 oracle 每个实例的的实际连接数和数据库配置的连接数Select count(1) from v$session; -实际连接的 session 数量show parameter session;如果实际连接的 session 连接数快要达到系统配置的 s

18、ession 数量,需要增加 session 的数量,以免有业务无法正常连接数据库4.1.1.13 检查数据库运行慢的 SQLSELECT USERNAME,SID,OPNAME,ROUND(SOFAR * 100 / TOTALWORK, 0) | % AS PROGRESS,TIME_REMAINING,SQL_TEXTFROM V$SESSION_LONGOPS, V$SQLWHERE TIME_REMAINING 100;4.1.2 Mysql 数据库运维主要检查项4.1.2.1 检查数据库备份是否正常检查是否有备份机制,已有备份机制,且最后一个备份成功为正常4.1.2.2 检查数据库

19、后台日志,最近是否有 error 错误检查 data 目录下 host_name.err 近期是否有错误4.1.2.3 检查 MySQL 数据库连接统计show status; 检查Aborted_clients 由于客户没有正确关闭连接已经死掉,已经放弃的连接数量。 Aborted_connects 尝试已经失败的 MySQL 服务器的连接的次数。Threads_connected 当前打开的连接的数量。 Max_used_connections 同时使用的连接的最大数目 以 Max_used_connections 远小于 f 中的最大连接数目则正常。如果接近则考虑增大最大数目。4.1.2

20、.4 检查 MySQL 数据库表锁统计(包括立即锁及等待锁)show status like table%; 如果 waited 的数值比较高,说明数据库锁争用比较严重 4.1.2.5 主库查看状态Show master status内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 10/16 页4.1.2.6 查询从服务器状态Show slave status,经常检查从服务器的复制状态,防止复制过程中出现故障从而导致进程停止4.1.2.7 Mysql 连接数排查Show variables like %max_connectins%Show gloable sta

21、tus like max_use_connections当前数据库已经使用的最大连接数不能超过阀值4.1.2.8 Mysql 文件打开数检查Show global status like open_files;Show variables like open_files_limit打开数量要小于 limit 值4.1.3 SqlServer 数据库运维主机检查项4.1.3.1 检查数据库自动备份是否正常检查是否有备份机制,以有备份机制,且最后一个备份成功为正常4.1.3.2 验证备份集验证备份集( RESTORE VERIFYONLY )4.1.3.3 检查数据库集群是否能正常工作4.1.3.

22、4 检查磁盘空间是否足够检查数据文件所在的磁盘空间使用情况检查日志文件所在的磁盘空间使用情况检查备份的磁盘空间使用情况4.1.3.5 检查系统日志使用“事件查看器” ,查看系统日志,关注错误信息排查错误。重点关注与 SQLServer 相关的日志信息。及时备份与清理过期的日志信息。4.2 数据库性能分析与优化调整根据用户需要进行数据库的性能分析,针对发现的问题提出合理的解决方案 ;每月巡检中包含对数据库运行性能的分析。内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 11/16 页主要包括:数据库性能的监控和调整、系统资源的监控及管理 。如: 优化服务器配置根据现有硬

23、件配置及用户访问量及服务器性能指标,确定是否存在系统(cpu,内存,硬盘)瓶颈及数据库配置问题,提出解决瓶颈的方法及建议。 优化应用程序根据应用程序配置,确定是否存在应用程序问题使系统运行缓慢,提出应用程序优化建议(如:负载均衡)。 数据库及应用程序整合分析数据库与应用布局是否合理,提出整合建议。 数据库参数调整优化参数,使数据库在最优的环境下运行。 数据库潜在重要问题数据库是否存在潜在问题,对数据库有什么重要的影响, 或深圳广西质量技术监督局方面认为紧急的。 优化内存配置与系统后台进程 优化物理文件的存放,对大型数据库考虑用磁盘阵列柜存放 优化数据库逻辑结构优化表空间、临时表空间、回滚段 优

24、化数据库对象优化表结构、建立分区表,优化索引结构、更新统计信息 优化 SQL 语句查询运行慢的 SQL 语句,并给出优化建议 提供数据库优化方案及实施方案、报告等4.3 数据库备份以及恢复服务根据现场情况,制定合理的备份计划,定期备份各个数据库。具备条件的情况下,要定期对备份集进行异机恢复,测试备份集是否可用。内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 12/16 页数据库发生重大故障时(如磁盘阵列故障导致的数据库瘫痪) ,以最快的速度从备份系统中恢复数据,并使系统能够在最短的时间内恢复正常运行。4.4 数据库补丁分析与安装根据用户需要提供相关系统软件升级服务;

25、当数据库 ORACLE、MYSQL、SQLSERVER 软件有最新更新升级时,维保方须及时通知广西质量技术监督局,并根据广西质量技术监督局的要求和安排到现场进行更新升级(每年一般不超过两次) 。4.5 7*24 小时数据库救援服务提供 724 小时应急响应热线,由具有丰富工作经验的资深 OCP 认证工程师 在用户的 Oracle产品出现重大故障时提供现场紧急救援服务。重大故障包括:OS 故障,导致 Oracle 不能正常启动或运行硬件故障(包括 CPU、硬盘等) ,导致数据库崩溃人为故障,包括维护人员不小心删除数据库文件,或人为将 Table 中的数据删除等等导致数据库不能正常运行的情况,如控

26、制文件遭破坏,Redo Log 文件遭破坏,数据文件遭破坏等等 其他故障,包括影响数据库正常运行的各类紧急故障内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 13/16 页5技术支持以及服务体系5.1 故障处理要求25 分钟内故障处理电话响应服务,故障服务的现场响应时间小于 1 小时,即 1 小时内有能够处理故障的技术人员到达现场,并立即投入对故障的处理,并能够在 2 个小时内恢复故障系统的正常运行。如果用户的问题不能通过电话解决,客户服务部会立刻派经验丰富的工程师到现场为用户解决问题,客户服务人员对解决的过程进行记录,并向用户提供解决问题的报告包括问题原因、解决方

27、法、解决问题的方式和进程,以及建议用户对系统进行正常使用的指导和培训问题解决后需要用户进行确认。5.2 重大活动现场护航敏感时期、重大节假日、领导巡查,维护技术原因提前入场做详细巡检,并于活动时间段内入驻客户驻地,提供 5*8 小时的现场保障服务 。在国家节假日期间前一个星期, 提供节日值班表,包含: 当日负责人姓名及联系电话、反应时间、到现场时间、处理好时间 等内容。 以发电子邮件方式告知客户负责人。内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 14/16 页5.3 维护作业计划为保障数据库系统的长效运行。我们制定 日、周、月 的检查内容,通过 自动、远程、现场

28、相结合的方式,形成日常作业计划,对数据库运行情况检查,及早发现问题和处理问题。如:每日的数据库表自动分析、每周的远程备份情况检查、每月的现场设备检查等 。5.4 信息安全保障系统的安全性是业务正常运行的保障,其重要性不言而喻。我公司会根据标准的安全规范和成功经验,为用户的系统进行安全性检查,包括文件权限的设置、用户访问的限制、增补软件的更新等技术方面,同时对系统安全策略进行评估,将发现的问题隐患及改进建议以报告的形式提交给用户。通过系统安全性检查,可以提高系统的安全级别,防止系统遭到恶性攻击口。5.5 第三方协助服务协助用户或第三方完成对系统设备、软件的维护、升级、扩容等技术支持工作,确保客户

29、生产系统的安全平稳运行。5.6 服务质量分析提供每月 1 次对 oracle、sqlserver、mysql 全面巡检服务,对维保范围系统进行细致全面地监视、检查、隐患排除等。并按照用户要求提供特殊时段保障要求的巡检。每月提交月度服务报告、包括并不限于服务天数、次数、电话接通延迟时间、报修故障及原因、恢复措施报告等定量数据;根据用户需要召开服务质量分析例会,对该阶段服务进行总结。并对例会纪要中的意见与建议部分于 7 日内反馈并跟踪落实。工程师将在巡检后进行日志分析,及时发现潜在故障隐患以及系统错误日志,并提供巡检报告一册,巡检报告内容包括设备运行状态、错误日志、以及针对问题的优化建议等。内部公

30、开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 15/16 页6 项目实施以及管理6.1 项目实施策略项目的实施成功与否主要表现为“两个机制、一个测试”:顺畅沟通机制和技术转移机制、模拟测试。顺畅沟通机制:建立和用户方的良好顺畅的协调机制;技术转移机制:系统在移交后,日常的管理工作有比较大的专业性,成功的技术转移是以后系统良好运作的前提和保证。建议用户方的技术牵头人和系统管理员对项目的全程深入参与。模拟测试:通过在模拟环境完成系统调试后并在真实环境完成试运行测试。因而在本次 Oralce日常运行维护服务的过程中,我公司将按照软件项目实施的策略来进行管理,从而保证整个项目的

31、维护就如同开发过程一样严格管理。6.2 项目实施计划ORACLE 产品日常运行维护年度服务项目是一个长期的优化维护项目,我公司根据多年的开发维护经验可分为两个阶段。第一个阶段为优化实施阶段,包括各个应用系统的环境情况调查,应用系统的统计登记、数据库系统的优化等。第二个阶段为运维阶段,主要包括相关应用的培训,数据库管理培训、数据库备份恢复的培训以及后期系统运维、检查等保护措施,定期对全厂数据库及系统进行巡检,巡检内容包括:系统日志、网络状况、系统空间状况、存储设备状态、系统性能、产品参数与配置、数据库各种文件的状态与配置、数据库安全审计、数据对象配置的合理性、实例的运行效率、SQL 代码性能调优等。6.3 项目交付文档6.4 交付要求我公司提供的资料将使用国家法定单位制即国际单位制,语言为中文。提供的纸介质文件时需同时提供 Office 电子版文件。资料的组织结构清晰、逻辑性强。资料内容正确、准确、一致、清内部公开本文中的所有信息均为秦唐科技有限公司所有,未经许可不得向外传播。第 16/16 页晰完整,满足项目要求。6.5 提交文件资料文档的内容至少包括系统的维护手册、数据库定期巡检记录、数据库日常运维手册、文档介质包括: 系统信息表 数据库日常运维手册 数据库定期巡检记录表 应用系统巡检记录 其他相关的技术资料

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 高等教育 > 专业基础教材

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报