1、什么是数据备份 数据备份顾名思义,就是将数据以某种方式加以保留,以便在系统遭受破坏或其他特定情况下,重新加以利用的一个过程。 数据备份的根本目的,是重新利用,这也就是说,备份工作的核心是恢复,一个无法恢复的备份,对任何系统来说都是毫无意义的。 作为最终用户,一定需要清醒的认识到,能够安全、方便而又高效的恢复数据,才是备份系统的真正生命所在。 一个好的备份系统,应该能够以很低的系统资源占用率和很少的网络带宽,来进行自动而高速度的数据备份。 数据备份作为存储领域的一个重要组成部分,其在存储系统中的地位和作用都是不容忽视的。对一个完整的 IT 系统而言,备份工作是其中必不可少的组成部分。其意义不仅在
2、于防范意外事件的破坏,而且还是历史数据保存归档的最佳方式。换言之,即便系统正常工作,没有任何数据丢失或破坏发生,备份工作仍然具有非常大的意义 为我们进行历史数据查询、统计和分析,以及重要信息归档保存提供了可能。 还有,数据备份更多的是指数据从在线状态,剥离到离线状态的过程,这与服务器高可用集群技术以及远程容灾技术,在本质上有所区别。虽然从目的上讲,这些技术都是为了消除或减弱意外事件给系统带来的影响,但是,由于其侧重的方向不同,实现的手段和产生的效果也不尽相同。集群和容灾技术的目的,是为了保证系统的可用性,也就是说,当意外发生时,系统所提供的服务和功能不会因此而间断。对数据而言,集群和容灾技术是
3、保护系统的在线状态,保证数据可以随时被访问。而相对来说,备份技术的目的,是将整个系统的数据或状态保存下来,这种方式不仅可以挽回硬件设备坏损带来的损失,也可以挽回逻辑错误和人为恶意破坏的损失。然而,一般来说,数据备份技术并不保证系统的实时可用性。也就是说,一旦意外发生,备份技术只保证数据可以恢复,但是恢复过程需要一定的时间,在此期间,系统是不可用的。在具有一定规模的系统中,备份技术、集群技术和容灾技术互相不可替代,并且稳定和谐的配合工作,共同保证着系统的正常运转。 备份、集群和容灾之间的比较表 数据备份技术 高可用集群技术 容灾技术 物理硬件故障 是 是 是 病毒发作 是 部分 部分 人为误操作
4、 是 部分 部分 人为恶意破坏 是 否 否 防范意外事件 自然灾害 否 否 是 数据和文件 是 是 是 应用和设置 部分 是 是 操作系统 部分 是 是 网络系统 否 否 是 保护对象 供电系统 否 否 是 系统连续性 不保证 保证 保证 数据损失 有少量损失 完全不损失 完全不损失 系统恢复 可恢复到时间点 多个 当前 当前 数据管理方式 搬移到离线 在线共享或同步 在线同步 其他方面 适用系统规模 任何系统规模 中型或大型系统 大型系统 备份的误区 在计算机系统中,最重要的不是软件、更不是硬件,而是存储在其中的数据。虽然这种观念以被人们所广泛认同,但如何保护存储在网络系统中数据,普遍存在以
5、下误区: 一、将硬盘备份等同与数据备份 是将磁盘阵列、双机热备份或者磁盘镜像当成备份 原因 A:从导致数据失效的因素可以看出,大部分造成整个硬件系统的瘫痪的原因,硬件备份是无能为力的。 原因 B:硬件的备份是受其技术设计前提所约束的。 硬盘 硬盘驱动器是计算机中损坏率比较高的设备,这是由硬盘本身的工作原理所决定的。硬盘驱动器利用磁头与盘面间的相对运动来读写,头与盘间利用空气轴承原理保持一定的间隙。随着存储密度的增加,间隙越来越小,极易因振动或冲击而造成头盘相撞,或因密封失效,使灰尘进入盘腔而引起盘片划伤,并且划伤这一类损坏是无法修复的,通常会造成数据丢失的严重后果。而且硬盘的损坏通常是突发性,
6、没有先兆的。 磁盘阵列 磁盘阵列 (RAID)是采用若干个硬磁盘驱动器按一定要求组成一个整体。其中有一个热备份 盘,其余是数据盘和校验盘。整个阵列由阵列控制器管理,使用上与一个硬磁盘一样。 磁盘阵列有许多优点。首先是提高了存储容量。单台硬磁盘的容量是有限的,组成阵列后形成的 “一台“硬磁盘容量将是单台的几倍或几十倍。现在用于服务器的磁盘阵列容量已达 TB 数量级。其次,多台硬磁盘驱动器可并行工作,提高了数据传输率。第三,由于有校验技术,提高了可靠性。如果阵列中有一台硬磁盘损坏,利用其它盘可以重组出损坏盘上原来的数据,不影响系统正常工作,并且可以在带电状态下更换坏的硬磁盘,阵列控制器自动把重组的
7、数据写入新盘,或写入热备份盘而使用新盘做热备份。可见,磁盘阵列不会使还没有来得及写备份的数据因盘损坏而丢失。 磁盘阵列的可靠性很高,但不等于不需要备份。理由之一是,磁盘总会损坏,一台盘坏了可以重组,两台盘同时坏了则无法重组。这种情况的概率并不等于 0。因此,为了以防万一,重要的数据要及时做备份。理由之二是磁盘阵列容量虽大但也有限,而且每兆字节成本高,在阵列上长期保存不用的数据,既影响工作效率,同时也是浪费。 双机热备份 双机热备份技术是国内对于相关技术的俗称。在国外,一般称为高可用系统 (High Availability System),它的基本原理是指同一个计算机应用软件系统,采用两个或两
8、个以上的主机 /服务器硬件系统来支持。当主要的主机 /服务器发生故障时,通过相应的技术,由另外的主机/服务器来承担应用软件运行所需的环境。因此,它主要解决的问题是保持计算机应用软件系统的连续运作。对于一些柜台业务系统、大数据量连续处理系统来说,这种数据管理是必不可少的。但对于天灾人祸来说,双机备份也是无能为力的,根据统计数字,在所有造成系统失效的原因当中,人为的错误是第一位的,对于人为的误操作,如错误地覆盖系统文件,则会同样发生在热备份的机器上,此外,备份除了制作第二份拷贝的这一层含义,还有一层历史资料的,双机热备也是无法作到的。 从上面的介绍中可以看出,无论是磁盘阵列也好,还是双机热备份,着
9、重点是增强了系统连续运行时的性能与可靠性,这些硬件备份与真正的备份概念还相差很多。 二、将拷贝等同于备份 备份不能仅仅通过拷贝完成,因为拷贝不能留下系统的注册表等信息;而且也不能留下历史记录保存下来,以做追踪;当数据量很大时,手工的拷贝工作又是何其麻烦。备份 =拷贝+管理。管理包括备份的可计划性、磁带机的自动化操作、历史记录的保存以及日志记录等等。 三、将备份等同于数据备份 在网络环境中,系统文件和一些应用程序的安装相当麻烦,而且需要重新设置各种参数和地址,这个过程通常会持续好几天,在这些系统环境恢复之前,数据文件是无法使用的。三种常用的备份方式 全备份( Full Backup) 所谓全备份
10、,就是用一盘磁带对整个系统进行包括系统和数据的完全备份。这种备份方式的好处是很直观,容易被人理解。而且当发生数据丢失的灾难时,只要用一盘磁带(即灾难发生前一天的备份磁带),就可以恢复丢失的数据。但它也有不足之处:首先,由于每天都对系统进行完全备份,因此在备份数据中有大量内容是重复的,例如操作系统与应用程序。这些重复的数据占用了大量的磁带空间,这对用户来说就意味着增加成本;其次,由于需要备份的数据量相当大,因此备份所需时间较长。对于那些业务繁忙,备份窗口时间有限的单位来说,选择这种备份策略无疑是不明智的。 增量备份 (Incremental Backup) 增量备份指每次备份的数据只是相当于上一
11、次备份后增加的和修改过的数据。这种备份的优点很明显:没有重复的备份数据,节省磁带空间,又缩短了备份时间。但它的缺点在于当发生灾难时,恢复数据比较麻烦。举例来说,如果系统在星期四的早晨发生故障,那么现在就需要将系统恢复到星期三晚上的状态。这时,管理员需要找出星期一的完全备份磁带进行系统恢复,然后再找出星期二的磁带来恢复星期二的数据,最后再找出星期三的磁带来恢复星期三的数据。很明显,这比第一种策略要麻烦得多。另外,在这种备份下,各磁带间的关系就像链子一样,一环套一环,其中任何一盘磁带出了问题,都会导致整条链子脱节。 差分备份 (Differential Backup) 差分备份就是每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据。管理员先在星期一进行一次系统完全备份;然后在接下来的几天里,再将当天所有与星期一不同的数据(增加的或修改的)备份到磁带上。差分备份无需每天都做系统完全备份,因此备份所需时间短,并节省磁带空间,它的灾难恢复也很方便,系统管理员只需两盘磁带,即系统全备份的磁带与发生灾难前一天的备份磁带,就可以将系统完全恢复。