CDP:我不是快照,我武功更高

发表于:2008-04-23来源:作者:点击数: 标签:需求
快照 在媒体对持续数据保护(Continuous Data Protection,CDP) 解决方案 的报道迅速升温后,最终用户也受到CDP即时数据恢复和零数据损失的吸引,但是有一个问题还有待于回答:CDP与快照的区别是什么?选择的依据是什么? 从表面上看,这两种数据保护方法有

快照

  在媒体对持续数据保护(Continuous Data Protection,CDP)解决方案的报道迅速升温后,最终用户也受到CDP即时数据恢复和零数据损失的吸引,但是有一个问题还有待于回答:CDP与快照的区别是什么?选择的依据是什么?

  从表面上看,这两种数据保护方法有很多共同之处。但是仔细对比之后,会发现一些重大差别。

  根据全球网络存储工业协会(SNIA)的定义,快照(Snapshot)是对出现在特定时刻的数据的复制。换句话说,快照是一个数据集的静态图像,这个数据集可以是一个处于特定时刻的Oracle数据库或家用文件系统。

快照的工作原理

  很多快照功能都可以归入两个大类之一:全复制或差别复制。

  全复制快照复制整个数据集。全复制快照常常通过称为镜像分离的流程来实现,3TB 数据库的全复制快照占用额外的3TB磁盘空间。

  差别复制快照仅处理上次快照之后出现的增量。这类快照占用较少的磁盘空间,但是需要更多的系统处理开销。差别快照技术有几种实施方式,如写即复制(CoW)、写即重定向(RoW)和随处写(WA)。

  这两种快照方法的重要区别在于存储成本和性能。此外,因为全复制快照不依赖于主数据,所以这种方法往往使某些类型的数据损坏更容易恢复。

快照价值主张

备份窗口

  快照可以迅速建立,并可用作传统备份和归档的数据源。因为宕机或应用中断窗口缩小为快照建立所需时间,所以快照可以缩小或消除备份窗口。

恢复窗口

  快照存储在磁盘上,而磁盘可以快速直接存取,这与磁带较慢的流式存取完全不同。从磁盘恢复比从磁带恢复速度快,而且就差别复制快照而言,还无需复制整个数据集。恢复所需时间常常称作恢复时间目标(RTO)。

多个恢复点

  很多时候由于快照建立时刻延迟而使数据损坏无法恢复。中午时刻建立的快照对于发生在上午11:59的数据损坏毫无用处。因此,有灵活和频繁的恢复点、或称恢复点目标(RPO)是很重要的。客户有时对快照进行旋转,以获得更高的RPO粒度。但是快照增多的代价是极大地提高成本。

重新确定数据用途

  用户常常要执行辅助操作,这些操作在生产系统上进行太昂贵或容易引起混乱。这些辅助操作可能包括归档之前的审计、报告、应用或升级测试、数据挖掘,等等。快照为这些操作提供一份接近实况数据的拷贝。

CDP

  “持续数据保护”中的关键词是持续。就给定数据集而言,CDP提供一个恢复点的连续体,能够存取任何时间点上的数据,而不仅针对那些由快照流程预先确定的特殊时刻。CDP允许应用恢复到特定事件之前,而不是恢复到预先确定的时间点上。恢复点在事件发生后选定并动态重建。

  CDP提供粒度无限的恢复点(RPO),有些情况下可以提供接近即时的恢复时间(RTO)。这是因为,一般情况下,一有写操作就进行CDP保护。每一次数据修改都记录在案,恢复可以发生在任何时间点,时间点的划分可以一直细化到单个写操作。

微粒度恢复

  CDP保护的一个重要优点是其微粒度性。对单个时间点图像的复制操作由于没有其他选择,就整个数据集而言缺乏微粒度性。有些复杂的方法可以用来实现一致性,但是在大多数情况下,单个时间点技术不具有微粒度性。这意味着,要建立一个恢复点,应用一定会受到影响。获取快照时,应用一般以某种方式置于静态。这个过程很复杂,而且容易引起故障。

  基于CDP的恢复具有微粒度性,这种方法可提供一个完整的数据集,无论应用在恢复时是否是静态的,数据集都可以恢复。这种能力常常称为紧急事故一致恢复,与容错和高可用性系统中采用的恢复模式相同。

  由于与生俱来的微粒度性,CDP可以实现非常强大和易用的恢复流程。

恢复效率

  有些CDP方案允许其RPO选项随着时间的推移向下移交。任意时间点恢复按照政策提供给一组时间段,而较靠后的时间段只能从专门存储的恢复点恢复。具有这种能力的CDP系统可以延展自己的恢复时间表,同时降低存储容量需求

CDP价值主张

备份窗口

  与快照类似,CDP去除了备份窗口。与大多数快照不同的是,CDP这么做是自动的,无需应用交互或干预。由于CDP恢复具有动态和非破坏性的特点,所以用户能够在不损坏内容完整性的前提下审计备份。

  与快照不同,CDP图像不是必须预先确定、管理和存储的单个固定时间点上的图像。CDP图像可以随意建立,因此允许在宽得多的范围内执行备份操作。例如,有了CDP系统,就可以在审计了午夜时数据的状况和可恢复性后,于早上7:00运行午夜备份;或者仅仅因为它允许日班人员执行备份而这样做。

恢复窗口

  就恢复而言,CDP系统分成两类。第一类提供虚拟化恢复,这意味着接近即时的恢复。虚拟化恢复允许在应用数据可用后,即在客户系统重新上线和运行后,处理此次恢复的数据移动任务。从恢复时间目标的角度看,没有比提供虚拟化恢复的CDP产品速度更快的产品了。

  另一类是大家熟知的定向恢复,也叫作向后或向前滚动恢复。这种恢复方法利用写操作的改写或重新运行记录及时将应用数据送回来。这种恢复的恢复时间取决于恢复操作要回溯的时间有多长,但是一般情况下,与快照恢复时间相同或比其快得多。快照恢复时间取决于快照利用差别复制的能力。

多个恢复点目标

  CDP提供无限个RPO,而快照系统提供的是单个RPO。有些厂商建议,通过建立多个快照来获得类似CDP的RPO能力。这一般来说是没有吸引力的,因为每个快照都是需要建立(在应用的干预下)、存储和管理(并非微不足道而且昂贵)的另一个目标。换句话说,快照要求用户在故障发生前预先确定可能的恢复点,然后管理每一个预先确定的点。CDP允许用户动态重建以前的任何数据点,而且是在故障发生后,因此恢复点可以确定在紧挨着故障发生的那一刻。

  此外,大多数CDP解决方案都具有用数据历史上的特定事件或特殊时刻解释时间表的能力,这使用户能够恢复到任何特定的时间点,以及恢复出在这些标定时间之间的任何数据。

重新确定数据用途

  CDP提供微粒度数据集,能以比快照高得多的灵活性重新确定数据的用途。CDP是动态建立数据图像的,数据图像可以反复重建,可以不受主线数据影响进行审计、保存和归档,还可以用作单个解决方案,向多个重新确定用途的活动提供数据。

  CDP已经走出了媒体宣传的纸上谈兵阶段,很多主流数据中心都已经定期使用CDP了。因为CDP拥有所有快照固有的优点,又比快照具有更细的粒度,恢复时间也短得多。

  如果零宕机时间和零数据损失是你的目标,那么CDP是惟一选择

原文转自:http://www.ltesting.net