1、第5章 网络存储备份技术,随着网络技术的不断发展,应用领域的快速扩张,不论是Internet还是企业和机构网络上的数据量都在成倍地增长,因而对数据访问的速度、可用性、可靠性、可管理性等要求变得非常突出。网络存储和备份技术就是解决上述问题的非常好的手段。对于大多数读者来说,存储与备份技术可能比网络、服务器等常用技术陌生得多,但目前对于大、中型网络系统而言,存储与备份技术几乎成为必备选项。因此,网络存储备份技术成为了网络系统集成的重要内容之一。,本章主要内容,网络存储技术 网络备份技术 常用网络系统备份方案 基于CA ARC Serve的典型备份案例,1,2,3,4,5.1 网络存储技术,九十年代
2、以前,存储产品大多作为服务器的组成部分之一,这种形式的存储被称为SAS(Server Attached Storage 服务器附属存储)或DAS(Direct Attached Storage,直接连接存储或直接附属存储)随着技术的发展,进入九十年代以后,人们逐渐意识到IT系统的数据集中和共享成为一个亟待解决的问题。于是,网络化存储的概念被提出并得到了迅速发展。从架构上来分,当今的网络化存储系统主要包括SAN(Storage Area Network,存储区域网络或称存域网络)和NAS(Network Attached Storage,网络连接存储或网络附属存储)两大类。本节介绍当前流行的几种
3、主要的存储技术:RAID DASSANNASiSCSI,5.1.2 RAID存储技术,RAID(Redundant Array of Independent Disks)是指独立磁盘冗余阵列,其最初所指为廉价磁盘冗余阵列。RAID阵列技术允许将一系列磁盘分组,以实现提高可用性的目的,并提供为实现数据保护而必需的数据冗余。RAID一般是通过磁盘阵列卡控制SCSI磁盘驱动器来实现的。RAID的实现方式:RAID可以通过硬件实现,也可以通过软件实现,但二者有着天壤之别。RAID硬件阵列是使用专门的磁盘阵列卡来实现的。RAID软阵列是通过支持RAID的操作系统进行配置和管理而实现的,如Windows
4、NT操作系统就能提供软件RAID功能。因软件RAID需要占用CPU时间,所以RAID模式越复杂,对于计算机系统影响就越大,运行效率也越低;再者,RAID系统受制于脆弱的操作系统,可靠性也很难保障,因此,除非经费受限,一般不建议采用。硬件RAID实现分为两种:一种是内置(或集成)RAID控制器,一种是外置RAID控制器。外置RAID控制器包括从控制器到硬盘等一套设备。外置RAID控制器比内置RAID控制器结构更加复杂,缓存容量更大,功能也更强大、可扩展性也更强。,磁盘镜像技术(1),磁盘镜像就是在一台服务器内安装二个(或者多个)独立的硬盘,即用一块磁盘控制器连接两个性能相同的硬盘。当系统工作时,
5、将数据同时存入这两个硬盘,这两份数据称为镜像关系。当一个硬盘出现故障时,可以使用另一个硬盘,从而保证网络系统正常运行。,磁盘镜像技术(2),不足之处:不能并行写入,因此存储数据的时候并不能提升速度。不过,在读取数据的时候镜像可以提升速度。RAID控制器可以读取镜像的两个设备中的任意一个的数据,当其中一个使用时,另一个空闲的可以响应其他的请求;磁盘镜像可以防止单个硬盘的物理损坏,但无法防止逻辑损坏;一旦磁盘控制器出现故障,整个网络系统就完全不能运行了。,奇偶校验技术,奇偶校验(Parity)是应用于RAID中的另一种冗余技术。RAID中的Parity类似于内存中的技术。不必把数据镜像,对整个硬盘
6、的数据进行奇偶校验运算,只需一个硬盘就能保证数据完整性,这就是奇偶校验技术相对于镜像技术的优势。考虑硬盘有可能崩溃,而多个硬盘同时崩溃的可能性极小,因此通过将奇偶校验数据分布在磁盘阵列的多个磁盘上,可实现更为可靠的分布式奇偶校验。奇偶校验技术的主要缺陷是:需要进行大量的运算,对于计算机CPU有着相当高的要求。每一次读取、写入数据都要进行一次奇偶校验运算,必须具备硬件RAID控制器,运用软件RAID几乎是不可能实现的;恢复数据比镜像技术复杂,恢复速度也要慢的多。,条块技术(1),条块(Striping)技术是把进入RAID控制器的数据分割成很多部分,每一部分为一个条块,再采用并行处理方式把条块数
7、据分布到RAID阵列的所有驱动器上。举个例子说明条块技术的工作原理:假设需要存储的数据分为了4块(A,B,C,D),且需要分布到3个硬盘上,那么第一个字节存储在第一个硬盘上、第二个字节存储在第二个硬盘上,第三个字节存储在第三个硬盘上,而第四个字节又存到一个硬盘上,如此循环。图5-2给出了条块技术工作原理示意图。,条块技术(2),如果某一个磁盘出了故障,如磁盘2有故障,可以通过读取磁盘1的数据(A、D、C)以及磁盘3的数据(C、B、A),恢复原始数据(A,B,C,D)。当需要移动、传输数据时,控制器将对两个硬盘同时存取,从而提高性能。条块分割是RAID中最具代表性的技术,它使得磁盘系统传输性能成
8、倍提高。在一定的范围内,可以说RAID阵列中的硬盘越多,性能的提高就越明显,而硬盘驱动器数目决定了条块带宽。条块技术的数据分块有两个级别:字节一级的条块数据块一级的条块条块容量的大小是实现RAID的一个很关键的技术,不同的应用中应该采用不同的尺寸。条块容量对于最终性能的提高或者降低影响很明显,条块容量越小,文件被分割的就越多,同时传输性能将因并行处理能力的提高而提高,但是也会增加文件存储的随机性。而使用大的条块容量所取得的效果同使用小的条块容量相反,数据分布和传输的性能将会减低,不过文件存放的随机性也会下降。,双机集群的磁盘阵列技术,双机集群的磁盘阵列见4.1.4节中的有关内容,示意图见图4-
9、3。在硬件上,于双数据库服务器之间设一组可伸缩的磁盘阵列,并以RAID-5技术将用户的共同数据存于共享磁盘组中。双机集群的磁盘阵列控制软件于多个处理器之间分配负载、应用、数据库,将其连接起来,使它们成为一个系统出现在用户面前。这样的双机集群磁盘阵列系统,可以克服单点故障的发生,在操作系统崩溃、网络控制失效或I/O故障时,控制软件均可检测出现的问题,并立即将应用操作转移到另外一个系统上。其故障恢复对用户是完全透明的。在灾难性事件发生时,仍可提供持续的计算能力,最大限度地减少停机时间,AdvFS(Advanced File System)实用程序重新启动系统只需几秒钟。整个系统的可靠性、可用性和高
10、服务性都将得到提高。,RAID的级别(1),RAID技术是一种工业标准,但各厂商对RAID级别的定义不尽相同。目前对RAID级别的定义可以获得业界广泛认可的有4种,即:RAID0RAID1RAID10RAID5,RAID的级别(2),RAID0:在阵列中采用了条块算法,即读/写数据时多块硬盘同时操作,数据被分散地写在各个硬盘上。具有成本低、读写性能极高、存储空间利用率高等特点,适用于音视频信号存储、临时文件的转储等对速度要求极其严格的特殊应用。但由于没有数据冗余和校验,其安全性大大降低,构成阵列的任何一块硬盘的损坏都将带来灾难性的数据损失。通常建议还要在RAID0中配置4块以上的硬盘,目的是减
11、少硬盘损坏的可能性。RAID1:是指两块硬盘数据进行完全镜像,即通常说的磁盘镜像,这种方式安全性高、技术简单、管理方便、读写性能好。RAID0的缺点是无法扩展,数据空间浪费大。RAID0一般用在操作系统和应用系统硬盘上。,RAID的级别(3),RAID10:即RAID0+1。综合了RAID1和RAID0的特点,独立磁盘配置成RAID0,两套完整的RAID0互相镜像(RAID1)。它的读写性能出色,安全性高,但缺点是构建阵列的成本投入大,数据空间利用率低,不是经济高效的方案。RAID5:是将各块独立硬盘进行条块化分割,相同的条块区进行奇偶校验,校验数据平均分布在每块硬盘上。以n块硬盘构建的RAI
12、D5阵列可以有n1块硬盘的实际可用容量,存储空间利用率非常高。任何一块硬盘上的数据丢失,均可以通过校验数据推算出来。RAID5具有数据安全、读写速度快、空间利用率高等优点,应用非常广泛。RAID5的缺点是写操作较慢,因为要进行校验数据的计算;另外,如果一块硬盘出现故障,系统要通过计算来恢复丢失的数据,使整个系统的性能将大大降低。RAID5是目前应用最广泛的RAID技术。,RAID的级别(4),如何为服务器选定RAID级别:有三个因素影响对RAID级别的选择。可用性(数据冗余)性能成本如果不需要可用性,那么RAID0将带来最佳性能。如果可用性和性能很重要而价格并不重要,可选择RAID1或RAID
13、10(视磁盘数而定)。如果价格、可用性和性能同样重要,那么选择RAID3、RAID5(视数据传输类型和磁盘驱动器数目而定)。,5.1.3 DAS存储技术,DAS(Direct Attached Storage,直接连接存储或直接附属存储)是指直接将存储设备连接到服务器上,连接方式有两种,即SCSI线缆和光纤通道。如图5-3所示。,DAS存储方式的特点,由于DAS是采用传统的连接方法,即每个服务器或客户端各自连接自己的DAS设备,使得DAS设备在安装的时候不必考虑其他服务器或客户端对其的影响,网络架构有固定的模式可以套用;DAS的主要优点是价格低廉、配置简单、使用方便。但因为网络对DAS的管理是
14、分散的,随着需求的不断扩大,越来越多的存储设备和服务器被添加进来,DAS环境将导致服务器和存储孤岛数量的激增,产生巨大的管理负担,并导致资源利用率低下。其缺点具体表现在如下几个方面:DAS存储系统不能提供不同操作系统下的文件共享。由于DAS设备与相应服务器或客户端靠SCSI接口连接,当存储容量不足时,想在网络中添加新的DAS设备的时候就会遇到麻烦,如SCSI接口卡的槽位数量,向网络中添加新的DAS设备时必须停顿整个网络服务等。DAS存储设备采用分散式管理,数据被存放在不同的地方,每做一次数据整理或设备维护,需要耗费大量的人力物力,有时结果却事倍功半。备份设备与DAS分离,进行数据备份时数据由D
15、AS设备到备份设备中需通过服务器,因此加重服务器负担。DAS数据存储设备不是独立的存储系统,向DAS设备中存取数据时,数据必须通过相应的服务器或客户端,加重了负担。,5.1.4 SAN存储技术(1),所谓SAN(Storage Area Network,存储区域网络或称存域网络),是指在网络服务器群的后端,采用光纤通道(FC,Fiber Channel)协议连接成高速专用网络,使网络服务器与多种存储设备直接连接。SAN通常由存储设备(专用磁盘阵列、磁带机)和光纤交换机组成。,5.1.4 SAN存储技术(2),从图中可以看出,LAN和SAN分别以各自的中心设备,即以网络交换机和光纤交换机为核心构
16、建,而服务器是它们的交点。每台服务器上都有一块网卡用以连接LAN,同时有一块主机总线适配卡(HBA,Host Bus Adapter)用以连接SAN,HBA卡的带宽通常为100MB/s。SAN是一个以光纤交换机为中心的、独立的数据存储网络,在此网络上使用的协议是光纤通道协议。SAN实际上是以数据存储为中心,通过具有较高传输速率的光通道连接方式,提供SAN内部任意节点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的存储区域网内,充分体现了功能分拆的思想,提高了系统的灵活性和数据的安全性。SAN的最大特点就是可以实现网络服务器与存储设备(例如RAID和磁带库)之间的多对多连接,而且,
17、这种连接是本地的高速连接,几个服务器共享存储访问,服务器通过光纤交换机连接到存储系统。如果SAN是基于TCP/IP的网络,则通过iSCSI技术,实现IP-SAN网络。,5.1.4 SAN存储技术(3) SAN的主要优点,性能相当高,光纤通道协议在传送大数据块时非常有效,这使得SAN非常适用于存储密集型环境;集中存取,更有效地利用存储资源;简单、集中的存储管理,降低了管理工作量,节约了时间和金钱;存储设备到服务器的多对多连接方式,提高了灵活性和可扩充性;集中的存储备份,其中性能、数据一致性和可靠性可以确保关键数据的安全,缩短了数据备份和恢复时间,提高了吞吐量;通过备份软件,可以做到Server-
18、Free和LAN-Free备份,减轻服务器和网络负担,降低了LAN拥塞;,具备恢复能力的网络设计,为确保业务连续性提供了更高的数据可用性;卓越的可扩展性和投资保护,可以根据业务需求轻松添加更多的存储设备;服务器和存储设备可以在物理上分离,确保动态存储分区,存储环境安全性更高;无需中断业务,即可添加或重新配置存储资源;保证短期和长期的投资回报;开放的、业界标准的光纤通道技术还使得SAN非常灵活。,5.1.4 SAN存储技术(4) SAN存在的主要问题,SAN解决方案的最大问题是成本较高,一般中小用户还难以承受每端口1000美元左右的光纤交换设备和相对较昂贵的光纤存储设备。SAN可以取代基于服务器
19、的存储模式,但SAN本身缺乏标准,互操作性也是一个主要问题。SAN是独立出的一个数据存储网络,整体网络内部的数据传输率很快,但操作系统仍停留在服务器端,客户端不能直接访问SAN的网络,而是通过相应的服务器操作系统访问SAN。即NT客户端NT服务器FC交换机存储设备,而UNIX客户端UNIX服务器FC交换机存储设备。因此造成SAN在异构环境下不能实现文件共享。,5.1.4 SAN存储技术(5),SAN和DAS的比较 SAN和DAS相比有很大的优势,SAN的可升级性、稳定性、可用性和性能都大大加强。不过,它最大的优势是集中的管理,这就降低了总拥有成本。无论是SAN还是DAS存储方案,服务器与存储设
20、备交换的都是数据块,所以比较适合于数据库应用。,5.1.5 NAS存储技术(1),NAS(Network Attached Storage,网络连接存储或网络附属存储),或称为网络直联存储设备、网络磁盘阵列。是一种将分布、独立的数据整合为大型、集中化管理的数据中心,以便于对不同主机和应用服务器进行访问的技术。通俗地讲是直接挂接在网上的、提供数据和文件服务的存储设备,实际上就是一台专用的NAS服务器。如图5-5所示。NAS服务器或称专用数据服务器,一般由处理器和磁带机、磁带库等存储硬件、存储操作系统以及其上的文件系统等几个部分组成。,5.1.5 NAS存储技术(2) NAS的主要优点,数据成为了
21、网络的中心,NAS设备是直接连接在网络上并单独作为一个文件服务器存在的,网络中所有设备的数据全部存储在这一个NAS设备中,简化了网络架构。将NAS设备连接到网络上非常方便。NAS设备提供RJ-45接口和单独的IP地址,可以将其直接挂接在主干网的交换机或其他局域网的HUB上,通过简单的设置(例如设置机器的IP地址等)就可以在网络上应用NAS设备了,完全是即插即用,而且进行网络数据在线扩容时也无需停顿网络,从而保证数据流畅存储,因此对照传统的服务器或DAS存储设备,NAS拥有更大的存储空间和相对低廉的价格。由于NAS设备的安装、调试、使用和管理非常简单,因此对于选用NAS作为网络数据存储设备的企业
22、用户来说,昂贵的设备管理与维护费用将不复存在。而且NAS设备在网络中占用一个IP地址,本身就相当于一台高性能的文件服务器,用户选用NAS设备后只须购买相应的应用服务器就行了,这样可以节省大量的设备成本。,5.1.5 NAS存储技术(3) NAS的主要优点,由于NAS是直接连接到TCP/IP网络(LAN或WAN)上,支持通用的网络存储数据传输协议,如NFS(Network File System,用于UNIX操作系统环境下,实现文件级的数据共享)和CIFS(Common Internet File System,用于Windows操作系统环境下,实现文件级的数据共享)等,所以不需要任何附加软件,
23、即可在几乎所有平台之间实现跨平台的数据共享。NAS设备采用集中式存储结构,摒弃了DAS的分散存储方式,网络管理员可以方便地管理数据和维护设备,同时NAS设备允许用户在网络上存取数据,有效改善了网络的性能。NAS与应用服务器之间交换的是文件,所以NAS产品比较适合于文件存储。,5.1.5 NAS存储技术(4) NAS的主要优点,NAS设备内置优化的独立存储操作系统,可以有效紧密地释放系统总线资源,全力支持I/O存储,因此NAS设备的效率较DAS设备高出60%以上。同时NAS设备一般集成本地的备份软件,可以不经过服务器将NAS设备中的重要数据进行本地备份,而且NAS设备提供硬盘RAID、冗余的电源
24、和风扇以及冗余的控制器,可以满足724小时的稳定应用。NAS设备一般会提供错误恢复系统,并会通过E-mail系统将报警信息自动发给系统管理员,同时NAS设备会进行动态监测,并提供详细的日志报告,以求全面保护数据。NAS产品是真正即插即用的产品。,5.1.5 NAS存储技术(5) NAS的主要缺点,NAS是直接挂接在网上的,因此会占用网络带宽资源,好在网络带宽也在迅速增长。但在进行大型文件传送时,往往引起网络拥塞。所以,NAS的局限性之一就是其网络传输数据的能力。NAS在传输数据的处理过程需要占用处理器资源来中断和重新访问数据流,如果数据包的处理占用太多的处理器资源,则在同一服务器上运行的应用程
25、序会受到影响。NAS存储的可扩展性也受到设备大小的限制。增加另一台设备非常容易,但是要像访问一台计算机上的数据那样访问网络环境中的内容并不容易,因为NAS设备通常具有独特的网络标识符。由于上述这些限制,NAS环境中的数据备份不是集中化的,因此仅限于使用直接连接存储设备(如专用磁带机或磁带库)或者基于网络的策略,在该策略中,存储设备上的数据通过企业或专用LAN进行备份。,5.1.5 NAS存储技术(6) NAS与磁盘阵列(RAID)的区别,NAS是一台服务器,有自己的核心,如CPU、内存、操作系统、磁盘系统,而RAID只是一个存储介质。NAS直接接到交换机或集线器上,不依赖于服务器。RAID接到
26、服务器后端,没有自己文件管理系统,完全依托于服务器,当数据流量很大时,给服务器造成的压力很大,易形成I/O瓶颈,使整个网络系统性能降低。RAID技术的出现,是为了提高数据存储的可靠性。NAS把RAID技术融合在它的文件系统中,这样既提高了数据的可靠性,又利用磁盘的并行操作,提高了系统的整体性能。当通用文件服务器的CPU进行I/O操作时,系统发生中断,等待I/O完成后才能恢复应用运行。在有NAS的系统中,应用程序需要进行磁盘I/O操作时,I/O操作由NAS完成,在磁盘I/O操作中最费时间的是写操作,NAS将写请求先写到NVRAM(不掉电内存)中,这个动作完成后,应用程序即可恢复运行,所以效率要高
27、得多。,5.1.6 存储技术的比较,SAN与NAS都是为适应高性能和密集的网络存储要求而在DAS的基础上发展起来的,是新型数据存储模式中的两个主要发展方向。DAS、NAS和SAN三种存储技术的比较见表5-2。今天,SAN已经渐渐与NAS环境相结合,以提供用于NAS设备的高性能海量存储。事实上,许多SAN目前都用于NAS设备的后台,还有很多企业把DAS、SAN、NAS的混合配置,以满足存储扩展性和备份的需要。如图所示。,5.1.7 网络存储新技术,虚拟存储技术。iSCSI存储技术:可以实现在IP网络上运行SCSI协议(SCSI over IP),类似光纤通道。iSCSI在实现上有不同的方式。假设
28、服务器上安装了iSCSI设备驱动,可以通过iSCSI协议传送I/O请求。这时,目标存储设备可以直接连接到iSCSI LAN上,例如IBM的Total Storage IP Storage 200i;另一种方式是连接到路由器,通过路由器连接到基于光纤通道的存储设备,例如Cisco 5420加IBM ESS。,5.1.8 存储产品的主要性能指标(1),数据保护能力:是指在存储设备的设计方面,对各种偶然性错误和意外情况的预期,以及采取的预防或补救措施。性能:性能指数主要有两个,带宽和IOPs(每秒I/O次数)。带宽决定于整个阵列系统,与所配置的磁盘个数也有一定关系;而IOPs则基本由阵列控制器完全决
29、定。在Web、E-mail、数据库等小文件频繁读写的环境下,性能主要由IOPs决定。在视频、测绘等大文件连续读写的环境下,性能主要由带宽决定。可见,在不同的应用方式中,需要考察的侧重点也不同。对NAS产品来说,主要性能指数也是两个:OPS和ORT,分别代表每秒可响应的并发请求数和每个请求的平均反应时间。对磁带存储设备来说,单个磁带驱动器的读写速度是最重要的性能指标。容量:用户不仅要关心产品的最大容量,还要关心扩容成本等问题。,5.1.8 存储产品的主要性能指标(2),连接性: 选择具有良好的开放性和连接性的产品,不仅是当前系统正常连接和运行的保障,也为系统将来扩展提供更大的空间和灵活性。管理性
30、:管理性是任何产品的重要方面之一。首先,用户应考虑产品所提供的管理功能或方式是否实用可靠。其次,支持中心化管理和远程管理的产品一定会令用户省事不少。还有,很多产品的故障自动通知机制给用户带来了方便,但同时也是数据安全的隐患。最后,在配置改变或系统扩容时,不需宕机或尽可能缩短宕机时间,是企业级产品的重要特征。附加功能:如数据快照功能、LUN Masking功能、异地数据复制功能等。,5.2 网络备份技术,网络备份系统是指在分布式网络环境下,通过专业的数据存储管理软件,结合相应的硬件和存储设备,来对整个网络的数据备份进行集中管理,从而实现自动化的备份、文件归档、数据分级存储以及灾难恢复等。其工作原
31、理是在网络上选择一台应用服务器(当然也可以在网络中另配一台服务器作为专用的备份服务器)作为网络数据存储管理服务器,安装网络数据存储管理服务器端软件,作为整个网络的备份服务器。在备份服务器上连接一台大容量存储设备(磁带库或光盘库)。在网络中其他需要进行数据备份管理的服务器上安装备份客户端软件,通过局域网将数据集中备份管理到与备份服务器连接的存储设备上。,备份的内容,重要数据的备份:重要的数据或数据库;系统文件的备份:例如注册表、System.ini、Win.ini等系统核心文件;应用程序的备份:用户的应用程序;整个分区或整个硬盘的备份:就是平时所说的系统镜像;日志文件的备份:动态在线备份。,备份
32、的层次,硬件级备份:是指用冗余的硬件来保证系统的连续运行,如果主硬件损坏,后备硬件马上能够接替其工作。这种方式可以有效地防止硬件故障,但无法防止数据的逻辑损坏。磁盘双工、镜像及磁盘阵列容错是磁盘系统安全可靠技术的具体实现,都是典型的 硬件备份措施。软件级备份:是指通过某种备份软件将系统数据保存到其它介质上,当系统出现错误时可以再通过软件将系统恢复到备份时的状态。当然,用这种方法备份和恢复都要花费一定的时间,还有可能会使系统间断运行。但这种方法可以完全防止逻辑损坏,因为备份介质和计算机系统是分开的,错误不会复写到介质上。人工级备份:人工级的备份最为原始和繁琐,也最有效。但全部数据都用手工方式恢复
33、是不可取的,实际上也是不可能的。理想的备份系统应该是全方位、多层次的,是在硬件容错的基础上,软件备份和手工方式相结合的,即应该是一种软硬措施集成的备份方式。首先,要使用硬件备份来防止硬件故障;如果由于软件故障或人为误操作造成了数据的逻辑损坏,则使用软件方式和手工方式相结合的方法恢复系统;如果系统出错,备份之前的数据用软件方法恢复,备份之后的数据用手工方式恢复。这种结合方式构成了对系统的多级防护,不仅能够有效地防止物理损坏,还能够彻底防止逻辑损坏,并保证系统在遭受意外破坏时能够很快恢复,使损失减到最小。,备份的方式,完全备份(Full Backup):将系统中所有的数据信息全部备份。其优点是数据
34、备份完整,缺点是备份系统的时间长,备份量大;增量备份(Incremental Backup):只备份上次备份以后变化过的数据信息。增量备份是进行备份最有效的办法,通常与完全备份一起使用提供快速备份,例如:许多单位在从星期五开始的周末运行完全备份,然后在下个星期一到星期四运行增量备份。其优点是数据备份量少、时间短,缺点是恢复系统时间长;差分备份(Differential Backup):只备份上次完全备份以后变化过的数据信息。差分备份需在完全备份之后的每一天都备份上次完全备份以后变化过的所有数据信息,因此,在下一次完全备份之前,日常备份工作所需的时间会一天比一天更长一些。其优点是备份数据量适中,
35、恢复系统时间短。各种备份的数据量不同,按从多到少的排序为:完全备份差分备份增量备份。在恢复数据时需要的备份介质数量也不一样:如果使用完全备份方式,只需上次的完全备份磁带就可以恢复所有数据;如果使用完全备份+增量备份方式,则需要上次的完全备份磁带+上次完全备份后的所有增量备份磁带才能恢复所有数据;如果使用完全备份+差分备份方式,只需上次的完全备份磁带+最近的差分备份磁带就可以恢复所有数据。,备份的类型,定期备份。远程磁带库、光盘库备份。远程数据库备份。在与主数据库所在生产机相分离的备份机上建立生数据库的一个拷贝,通过通信线路将生产机的数据库日志传到备份机,使备份数据库与主数据库保持同步。 网络数
36、据镜像。远程镜像磁盘。通过高速光纤通道线路和磁盘控制技术将镜像磁盘延伸到远离生产机的地方,镜像磁盘数据与主磁盘数据完全一致,更新方式为同步或异步。,网络备份的功能,集中式管理网络。备份管理系统对整个网络的数据进行管理。全自动的备份。备份系统能根据用户的实际需求,定义需要备份的数据,然后以图形界面方式根据需要设置备份时间表,备份系统将自动启动备份作业,无需人工干预。这个自动备份作业是可自定的,包括一次备份作业、每周的某几日、每月的第几大等项目。设定好计划后,备份作业就会按计划自动进行。数据库备份和恢复。在今天,数据库系统已经相当复杂和庞大,用文件的备份方式来备份数据库已不合时宜。是否能够将需要的
37、数据从庞大的数据库文件中抽取出来进行备份,是网络备份系统是否先进的标志之一。归档管理。用户可以按项目、时间定期对所有数据进行有效的归档处理。,5.2.2 主要存储备份介质,硬盘存储备份介质内部的磁盘机制(硬盘)外部系统(磁盘阵列等)光学存储备份介质CDROMWORM磁光盘驱动器(MO)磁带存储备份介质4mm磁带机8mm磁带机DLT磁带机DAT磁带机LTO磁带机,5.2.3 网络存储备份软件,备份软件技术在整个数据存储备份过程中具有相当的重要性,因为它不仅关系到是否支持磁带的各种先进功能,而且在很大程度上决定着备份的效率。有人认为,最好的备份软件就是操作系统所提供的备份功能,诸如Unix的tar
38、/cpio、Wndows2000/NT的Windows Backup、Netware的Sbackup等。其实不然,因为这些操作系统仅能提供一些基本的备份功能,缺乏专业备份软件的高速度与高性能,目前比较流行的专业备份软件有CA的ARCserve2000、Veritas的BackupExec以及Legato的Networker等。,优秀备份软件应具有的特点,安装方便、界面友好、使用灵活;备份软件应提供集中管理方式,用户在一台机器上就可以备份从服务器到工作站整个网络数据。支持跨平台备份;支持文件打开状态备份;支持在网络中的远程集中备份;,支持备份介质自动加载的自动备份;支持多种文件格式的备份;支持各
39、种策略的备份方式。备份策略指确定需要备份的内容、时间及备份方式。支持多种备份介质,如:磁带、MO光盘等。支持快速的灾难恢复。,5.3 常用网络系统备份方案,对系统进行全面的备份,并不只是拷贝文件那么简单。一个完整的系统备份方案,应包括四个部分:备份硬件和软件的选择备份方案的设计日常备份制度灾难恢复措施,5.3.1 备份硬件和软件的选择,对备份硬件的要求:备份设备应支持实时数据压缩,以进一步提高备份速度。备份介质应价格便宜、可靠性高、可以重复使用、便于移动(备份的数据可以随时保存到安全的地方),备份介质的容量应不小于现有系统的平均数据量(GB级)。备份硬件的技术成熟、可维护性好。备份软件的选择:
40、好的备份硬件是完成备份任务的基础,而备份软件则关系到是否能够将备份硬件的优良特性完全发挥出来,在选择上更不能掉以轻心。在选择备份软件时,除了前面的一些要求外,还应考虑以下几点:软件质量保证程度;软件对系统性能的影响;软件的可扩充性;软件的运行费用。网络备份系统工具是网络管理人员必不可少的工具,国外对这方面的研究和开发开始于80年代中期。到目前为止,成熟的产品不多,其中使用最广泛的是CA(Computer Associates)公司的ARC Serve。,ARC Serve的特性,集中式管理、跨网络备份。灾难的防治与恢复。如果在网络备份的基础之上实施灾难恢复措施,在系统毁损而必须重新安装操作系统
41、及应用程序的状态下,以简单的几个步骤跳过重新安装,可以直接将毁损系统在极短的时间内恢复原状,包括操作系统、系统设置、应用程序及所有的数据。内置防毒软件,备份前扫描病毒,可以实现无毒备份。智慧预警系统。当备份发生异常或正常作业完成时,可通过传呼、E-Mail、网络广播等方式自动通知管理员。,跨平台支持。可从单一的网络平台上备份MS-DOS、Netware、Windows98/NT、OS/2、UNIX等不同平台的数据。支持从服务器到工作站的全面网络备份。支持多种备份介质。使用简单,自动化程度高。ARC Serve可以实现无人值守的自动备份,无需派专人管理,备份过程中还可进行备份程序自动化与自动化磁
42、带管理。全面保护NetWare和Windows NT操作系统;支持打开文件备份。,5.3.2 系统备份方案的设计,典型的SAN备份解决方案:BrightStor EB、BrightStor ARCserve Backup、BrightStor Mobile Backup等备份软件安装在主机和工作站上。主机的数据通过光纤协议集中到一个SAN交换机上,然后由该交换机把数据转移到路由器上,再由路由器控制磁带库进行数据备份,或直接由交换机控制磁带库的备份。,5.3.3 日常备份制度设计,日常备份制度(Backup Routines)描述了每天的备份以什么方式,使用什么备份介质进行,是系统备份方案的具体
43、实施细则。在制订完毕后,应严格按照制度进行日常备份,否则将无法达到备份方案的目标。日常备份制度包括:磁带轮换策略日常操作规程,磁带轮换策略(1),三带轮换策略这种策略只需要三盘磁带。用户每星期五用一盘磁带对整个网络系统进行增量备份,因此,可以保存系统三个星期内的数据。适用于数据量小,变化速度较慢的网络环境。但这种策略有一个明显的缺点,就是周一到周四更新的数据没有得到有效的保护。如果周四的时候系统发生故障,就只能用上周五的备份恢复数据,那么周一到周四所做的工作就都丢失了。,磁带轮换策略(2),六带轮换策略这种策略需要六盘磁带。用户从星期一到星期四的每天都分别使用一盘磁带进行增量备份,然后星期五使
44、用第五盘磁带进行完全备份。第二个星期的星期一到星期四重复使用第一个星期的四盘磁带,到了第二个星期五使用第六盘磁带进行完全备份。如表5-3所示。,磁带轮换策略(3),祖-父-子(GFS:Grandfather-Father-Son)轮换策略 将六带轮换策略扩展到一个月以上,就成为祖-父-子轮换策略。这种策略由三级备份组成:日备份、周备份、月备份。日备份为增量备份,月备份和周备份为完全备份。日带共四盘,用于周一至周四的增量备份,每周轮换使用;周带一般不少于四盘,顺序轮换使用,用于星期五进行完全备份;月带数量视情况而定,用于每月最后一次完全备份,备份后将数据留档保存。这种轮换策略能够备份一年的数据。
45、根据周带和月带的数量不同,常见的祖-父-子轮换策略有21盘制、20盘制、15盘制等。下面以20盘制为例介绍其轮换策略原理。,磁带轮换策略(4),每日增量备份(4盘):周一至周四,每周轮换使用。每周完全备份(4盘):每周五使用一盘,每月轮换一次。每月完全备份(12盘):每个月的最后一个周五,每年结束后可存档或重新使用。如表5-4所示。,日常操作规程,使用20盘制轮换策略的参考操作规程如下:准备工作:将20盘磁带分为4盘日带、4盘周带、12盘月带,并在磁带标签上标注周一周四、第一周第四周、1月12月。日常操作:如果使用ARC Serve的自动备份功能,管理人员每天的备份工作仅仅是更换一下磁带,并看
46、一看最近的备份记录是否正常;如果使用了磁带库,连磁带也不用人工更换,只需每天查看备份记录即可。更换磁带要遵循以下三条原则:周一周四使用相应的日带;每月的最后一个周五使用该月的月带;其余周五根据当天是第几个周五使用对应周带。为了避免日带使用过于频繁,1月4月可以先将5月8月的月带作为日带使用4个月;5月8月时再将9月12月的月带作为日带使用4个月;到了9月12月才使用真正的日带。,5.3.4 灾难恢复措施设计,灾难恢复措施(DRP:Disaster Recovery Plan)在整个备份制度中占有相当重要的地位。因为它关系到系统在经历灾难后能否迅速恢复。灾难恢复措施包括:灾难预防制度灾难演习制度
47、灾难恢复,灾难预防制度,为了预防灾难的发生,需要做灾难恢复备份。灾难恢复备份与一般数据备份不同的地方在于,它会自动备份系统的重要信息。在Windows NT下,灾难恢复备份要备份NT的必要启动文件、注册表文件的关键数据、操作系统的关键设置等;在Netware下,灾难恢复备份要备份驱动程序、NDS、非Netware分区等重要数据。利用这些信息,才能快速恢复系统。ARC Serve对灾难恢复有充分的支持,备份普通数据的同时就可以进行灾难恢复的备份,只需选中ARC Serve中一个选项即可。用于灾难恢复的软盘,则要使用灾难恢复选件进行生成。灾难恢复盘必须和灾难恢复备份一起使用,方能恢复系统。关于灾难
48、预防制度,有两点建议:灾难恢复备份应是完全备份;在系统发生重大变化后,如安装了新的数据库系统,或安装了新硬件等,建议重新生成灾难恢复软盘,并进行灾难恢复备份。,灾难演习制度,要能够保证灾难恢复的可靠性,光进行备份是不够的,还要进行灾难演练。每过一段时间,应进行一次灾难演习。可以利用淘汰的机器或多余的硬盘进行灾难模拟,以熟练灾难恢复的操作过程,并检验所生成的灾难恢复软盘和灾难恢复备份是否可靠。,灾难恢复,拥有完整的备份方案,并严格执行以上的备份措施,当您面对突如其来的灾难时,就可以应付自如。灾难恢复的步骤非常简单:准备好最近一次的灾难恢复软盘和灾难恢复备份磁带,连接好磁带机,装入磁带,插入恢复软
49、盘,打开计算机电源,灾难恢复过程就开始了。根据系统提示进行下去,就可以将系统恢复到进行灾难恢复备份时的状态。再利用其它备份数据,就可以将服务器和其它计算机恢复到最近的状态。,5.4 基于CA ARC Serve的典型备份案例,环境及要求:两台Netware服务器,一台为文件服务器,另一台为数据库服务器,运行Betrieve。要求实现整个网络的数据及系统备份。方案一:将数据库服务器作为备份服务器,软件配置为:ARC Serve for Netware + Disaster Recovery Option。这种方案可以实现以下功能:整个网络中非活跃文件备份;数据库关闭状态备份;系统关键信息(NDS
50、或Bindery)备份;系统灾难恢复。方案二:将数据库服务器作为备份服务器,软件配置为:ARC Serve for Netware + Disaster Recovery Option + Backup Agent for Betrieve。此可以实现以下功能:整个网络中非活跃文件备份;数据库打开状态备份;系统关键信息(NDS或Bindery)备份;系统灾难恢复。方案三:将数据库服务器作为备份服务器,使用磁带库作为备份硬件。软件配置为:ARC Serve for Netware + Disaster Recovery Option + Backup Agent for Betrieve + Backup Agent for Open Files + Tape Library Option + RAID Optionfor Tape Library。这种可以实现以下功能:整个网络的文件备份,包括活跃状态的文件;数据库打开状态备份;系统关键信息(NDS或Bindery)备份;系统灾难恢复;备份数据的RAID容错;无人值守的备份。,