1、备份容灾基础知识,学习目标,备份中的常见技术,备份的发展历程,常见备份类型,容灾基础知识,爱数产品线,2,3,5,6,备份基础概念,4,1,1,爱数备份容灾方案简介,7,备份的基础概念,什么是备份,3,SNIA(存储网络工业协会)对 Backup 的定义: 1、(名词)一组存储在非易失性的(通常是可移动的)存储介质上的数据集合,它的目的是用于当原始数据丢失或不可用时能够及时恢复,备份也称为备份拷贝。,备份的根本目的:数据恢复; 备份解决的问题:数据不丢失的问题,什么是备份,3,站在备份的角度看备份,数据库,文件,操作系统,应用程序,硬盘光盘磁带,打包的备份集,能记录某一时间点状态的数据备份数据
2、存放于与原数据不同的介质中可多个不同时间点的副本,数据源,备份过程,存储介质,数据库和操作系统,3,数据库,操作系统,九大主流数据库,Oracle、DB2、SQL server、Sybase、 My SQL、Domino、Sharepoint、Active Directory、Exchange,windows、unix、linux,为什么需要备份,3,“备份”重要性,硬件故障,误操作,软件故障,保留历史记录,灾难性事件,病毒入侵,你能说出几个?,备份中的三个关键指标,3,备份窗口(Backup Windows)_ 指的是完成一次给定备份所需的时间 RTO (Recovery Time Obje
3、ctive) 恢复时间目标 是指灾难发生后,从I/T系统停机导致业务停顿开始,到IT系统恢复可以支持业务恢复运营之时,所需要的时间为RTO,这不仅要考虑数据的恢复时间,还应该考虑恢复后数据的完整性、一致性的修复和确认、备份中心计算机处理系统的启动和备份中心的网络切换等全部时间RPO (Recovery Point Objective) 恢复点目标 发生意外灾难事件时可能丢失的数据量。是指能够恢复至可以支持业务运作,系统及数据恢复到怎样的更新程度可以是上一周的备份数据,也可以是上一次交易的实时数据,RPO与RTO,3,恢复点目标 (RPO):客户容许的最大数据丢失量 恢复时间目标 (RTO):客
4、户容许的最长停机时间 定时备份:客户可以根据自己需求设置备份时间,每隔多久自动备份一次,如天12点备份一次、每周备份三次等等。所以定时备份会有时间间隔。 实时备份:只要备份对象有数据变化,都会将变化的数据备份到备份的存储介质。,备份的类型,备份类型,3,完全备份 差异备份 增量备份 合成备份(通常只针对于文件) 日志备份(通常只针对于数据库或特殊应用系统),在线备份(online backup)或热备份(hot backup) 离线备份(offline backup)或冷备份(cold backup),备份类型-完全备份,SNIA的定义: 将所有指定的数据对象都进行备份(不论数据对象自上次备份
5、之后是否修改过)的备份过程。完全备份是进行增量备份的基础。,第一次备份:,周一,周二,周三,周四,1,2,数据源:,1,2,3,4,1,2,3,4,第二次备份:,5,6,7,8,1,2,3,4,5,6,第三次备份:,1,2,3,4,5,6,7,8,第四次备份:,观点: 1、为其他备份类型的基础; 2、恢复简单,且效率高; 3、数据被多次重复备份,冗余大; 4、备份耗时长,效率低; 5、需根据数据总量合适制定备份策略;,备份类型-差异备份,SNIA的定义(累积增量备份): 一种备份技术,在该备份技术中,自上次完全备份以来所有修改过的数据对象都要进行备份。对于使用累积增量备份技术的数据,要实现数据
6、的恢复,只需要最近一次的完全备份数据以及最近一次的累积增量备份数据。,第一次备份:,周一,周二,周三,周四,1,2,数据源:,1,2,3,4,3,4,第二次备份:,5,6,7,8,3,4,5,6,第三次备份:,3,4,5,6,7,8,第四次备份:,观点: 1、始终以最近一次完备为基础; 2、增量数据被多次重复备份,有冗余; 4、备份效率相对较低; 5、恢复时需要最近一次完全备份和选定的差异备份时间点的数据;,备份类型-增量备份,SNIA的定义(差分增量备份): 一种备份技术,在这种备份技术中,对所有自上次完全备份或者增量备份操作以来所修改过的数据对象进行备份。要恢复使用差分增量备份技术的数据,
7、需要最近完全备份操作的备份数据以及所有差分增量备份所备份的数据而非最近差分增量备份所备份的数据。,第一次备份:,周一,周二,周三,周四,1,2,数据源:,1,2,3,4,3,4,第二次备份:,5,6,7,8,5,6,第三次备份:,7,8,第四次备份:,观点: 1、以最近一次完备或增量为基础; 2、无数据被重复备份,备份数据量小,效率高; 3、恢复时需要最近一次完全备份和后续的连续的增量备份;,备份类型-合成备份,3,Sat.,Fri.,Tues.,Weds.,Thurs.,Mon.,Sun.,客户端,备份服务器,介质,介质,Sun.,合成备份的价值:合成备份不占用客户端和服务器间的网络带宽;合
8、成备份可回收介质上备份数据占用的空间; 不占用客户端资源;,备份类型-日志备份,3,什么是事务日志?,TODO-事务日志的图解,事务日志是数据库中已发生的所有修改和执行每次修改的事务的一连串记录。事务日志记录每个事务的开始。它记录了在每个事务期间,对数据的更改及撤消所做更改(以后如有必要)所需的足够信息。,观点: 1、事务日志备份的目的是为了更精确的数据恢复。 2、事务日志与数据库或应用类型相关,每种数据库或应用的日志都有些差别; 3、事务日志备份建立在完全备份的基础上;,TODO-事务备份与恢复的原理解析,备份类型,3,在线备份(online)与热备份(hot backup): 一种备份方法
9、,在在线备份中,正在备份的数据在备份过程中仍然可以被应用程序访问。数据集合的在线备份通常是使用数据的冷映像(frozen image)来完成。,离线备份(offline backup)与冷备份(cold backup): 一种备份方法,在离线备份中,正在备份的数据在备份过程中不能被应用程序访问。,观点: 1、数据库、应用及重要文档都需要以在线备份的方式进行。 2、离线备份也建议定期进行,增强数据的安全性; 3、在做数据恢复、迁移、结构调整等工作时,在开展工作之前,务必对原数据进行一次离线备份(冷备份);,备份策略,3,来自SNIA的解释: 一种IT安装规则,决定备份执行的时间和方式。备份策略指
10、定了备份的信息,例如需要备份的文件或者目录名、备份执行的时间、可以接收备份的设备和介质、进行备份的份数,以及备份操作失败时的处理等。,观点: 1、策略需要结合用户对RPO/RTO的需求及用户实际环境制定; 2、若数据量小,备份策略可设置更频繁,数据量大,可灵活设计完全、增加、差异的组合策略。 3、备份时间一般设置在晚上,以免影响业务运行; 4、对每台服务器的备份,应避免在同一时刻进行; 5、策略需要根据用户数据量的增长定期调整;,策略举例: 数据源:SQL Server/(local)实例; 目的地:介质服务器/media 1; 压缩策略:不压缩; 加密策略:AES 256高强度加密; 时间策
11、略:每周日 23:00 做完全备份, 周一到周六 23:00做差异备 份;每天每两个小时做事务 日志备份; 备份数据保留策略:保留4个完全备份副本;,备份的发展历程,备份的发展历程,3,按备份方式:,手工备份与自动备份,按备份存储介质:,磁带机/磁带库/VTL/磁盘/一体化设备,90年代,00年代,现在,磁带VS磁盘,3,标签脱落,无人工标签,备份方式-手工备份,3,独立本地备份(手工备份),手动,用户每次都要自己配置备份任务 无规律,没有策略 缺乏对备份数据的管理(用户不知道备份内容),备份方式-自动备份,3,网络备份(自动备份),进入了大容量自动化备份时代 备份过程有策略管理,无需管理员介
12、入 应用了新的备份技术 恢复数据的过程简单,更自动化,Server,Backup Server,Storage,Clients,LAN,备份存储介质-基于磁带的数据备份,3,用途 尤其适用于单台服务器或工作站的系统备份,数据备份 缺点 TODO,LAN,SCSI,SAS,HP DAT(DDS) 磁带机,服务器或工作站,USB,HP LTO 磁带机,HP RDX 移动硬盘备份系统,在20世纪末比较常见的 -单服务器备份解决方案,备份存储介质-基于磁带库的数据备份,3,数据库服务器,数据备份软件(如HP Data Protector ),磁带库:带库是磁带机的升级产品,一般由多个机械臂、磁头和带舱
13、组成,是用于海量数据离线存储和备份的设备。 用途 适用于多台服务器环境下的数据集中备份; 特点 相对于磁带机,备份效率提升,空间利用率有所提升,管理方面也有所提升;,备份存储介质-基于虚拟磁带库(VTL)的数据备份,3,Data Center,UNIX Servers,Windows Servers,Heterogeneous Storage,Backup Server,NearStore VTL,2,虚拟磁带库就是用磁盘这种介质做的磁带库。 虚拟磁带库备份和恢复的速度比较慢,恢复时还得一个卷一个卷找,如果没有贴标签很容易混淆,而且数据恢复失败的几率比较高。,备份存储介质-基于磁盘的数据备份,
14、3,数据备份软件(如爱数备份软件企业版),SAN FC- Switch,Disk Array,VLS虚拟磁带库,LAN,数据库服务器,Mission Critical Data,Business Critical Data,应用服务器,备份服务器,D2D4312磁盘备份系统,磁带库,磁盘备份,磁带备份,用途 适用于复杂网络环境下大数据量的集中备份 特点 备份恢复速度快,方案灵活,易管理,备份存储介质-基于一体化备份设备的数据备份,3,邮件服务器,文件服务器,数据库服务器,爱数备份存储柜,客 户 端,用途 适用于复杂网络环境下大数据量的集中备份 特点 1、无需购买单独的备份服务器、存储、备份软件
15、、操作系统,实施部署简单; 2、简化了后期维护和管理; 3、兼容性、稳定性强、性价比高;,备份中的常见技术,快照与备份,3,快照是实现备份的一种技术方式之一:- 基于主机的快照,如VSS,LVM- 基于存储的快照,EMC/NetApp,1,2,3,A,G,A,G,快照的实现方式包括:- 克隆型,Split-Mirror- 指针型,Copy-on-Write,是CDP技术的前身,通常是备份软件是的整合的一项功能之一。,4,快照默认是在本机引用,如果不通过备份软件迁移到备份介质上,则不安全。,持续数据保护(CDP),3,根据SNIA的定义,CDP应具备特征:数据的更动必须连续的被记录与追踪。所有数
16、据的变化历程都被保存在与主储存地点不同的独立地点。数据还原点(Recovery point objectives,RPO)是任意的。 只要数据有变化,就会将变化的数据备份,而且可以做到任意时间点数据恢复。,重复数据删除技术,3,Data Deduplication,消除重复的数据块,同样的数据仅保存一次 在线和事后重复数据删除两种方案 基于哈希和基于内容的识别方法 适用于大数据量环境(10TB以上) 适用于远程数据备份环境,细粒度恢复技术,3,容灾基础知识,容灾的概念,3,灾难恢复 “将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接
17、受状态的活动和流程”。 重要信息系统灾难恢复指南,2005年4月,国信办 备份的目的:原始数据丢失后,可以做数据恢复 备份解决的问题:数据不丢失的问题 容灾的目的:数据恢复,应用接管 容灾解决的问题:数据不丢失,业务不间断,容灾的关键指标,3,+,= LO$,恢复点目标(RPO),备份窗口( Backup Window ),恢复时间目标(RTO),一次备份所需要 的时间,发生灾难时容许 的最大数据丢失量,发生灾难时容许 的最长停机时间,高可用技术(HA),3,备,主,共享存储,心跳线,最简单的双机HA 方案,双机的原理: 主服务器和备用服务器共享同一个存储,主服务器 发生故障宕机,备用服务器马
18、上可以接管主服务器 应用,达到应用不间断的目的缺陷:如果共享存储发生故障,会导致数据丢失,数 据丢失也会影响系统的正常运行。解决方案:需要对共享存储做备份应用容灾:既对存储数据做了备份,保证数据不丢失, 还可以保证服务器停机后马上接管应用,做到业务的 连续性。,爱数产品线,爱数备份容灾产品线,3,爱数备份容灾产品线,3,备份软件与一体化设备,3,爱数一体化备份存储柜,爱数备份容灾方案简介,爱数 医院数据集中备份方案-存储柜,HIS系统Unix,磁盘阵列,以太网,光纤网,基于爱数备份存储柜的数据集中备份方案,数据集中备份,LIS(实时备份),PACS,集中备份,RIS,爱数 医院数据集中备份方案
19、-软件,HIS系统Unix,磁盘阵列,以太网,光纤网,基于爱数备份软件的数据集中备份方案,数据集中备份,LIS(实时备份),PACS,集中备份,RIS,爱数备份软件服务端,爱数 医院数据集中备份容灾方案,HIS系统Windows/Linux,磁盘阵列,以太网,光纤网,基于爱数备份存储柜的虚拟化应用容灾系统,数据集中备份,实时数据复制/容灾接管,LIS,PACS,应用容灾,集中备份,存储扩容,异地数据备份方案,3,WAN,本地办公室 1,本地办公室 2,本地办公室 3,远程数据中心,基于D2D2R的远程备份;轻松实现数据异地容灾,获得最佳数据保护效果。,备份的误区,备份的误区,3,无任何数据保护
20、(没做过备份容灾) 可以给客户了解一下备份容灾的重要性 手工拷贝 手工备份费时费力,一旦忘记备份而发生数据丢失,情况严重 ,而且数据量很大的情况,手工备份复杂,而且无法实时备份。 双机 双机只能保证业务连续性,不能保证数据丢失,如果存储 损坏带来数据丢失,双机也无法继续运行业务。 系统自带的备份 系统自带的备份只能对数据进行导入导出,容易泄密,而且不 能实时备份,我们的产品有密码保护,能够对系统、数据库、 文件全面备份。 数据库自带备份 数据库运行的基础是操作系统,如果系统发生问题,数据库 也没有办法单独的运行,数据库其实本身的安装过程也非常 的繁琐和复杂,如果能把一些配置文件和操作系统备份下
21、来, 可以实现数据510分钟之内恢复系统,还能确保数据库的数 据不丢失。,脚本备份 需要备份的系统、数据库类型太多了,管理的效率比较低,而且对于备份集没法进行集中的管理,造成数据可能恢复不回来 raid 只能防止硬盘损坏导致的数据丢失,数据逻辑错误、人工误删除、病毒、自然灾害导致的数据丢失是无法避免的。 磁带备份 现在的主流备份介质是磁盘,磁带是顺序读写的介质,备份和恢复的速度比较慢,而且数据恢复失败的几率比较高。 虚拟磁带库做备份 虚拟磁带库备份和恢复的速度比较慢,恢复时要一个卷一个卷找,非常麻烦,而且数据恢复失败的几率比较高。 购买专业的备份产品 1、备份只能保证数据不丢失,一体化容灾既可以保证重要数据不丢失,还可以保证核心业务系统的连续性。 2、请问是用的哪个厂商的产品呢? 国外的产品用起来比较繁琐,效率不高 3、是否做过数据恢复,客户数据安全状态无任何数据保护、手工拷贝、双机、系统自带的备份、数据库自带备份、自己写的脚本备份、 raid、已经购买了专业备份产品,