基于CDP全面数据保护的灾备设计

2011-06-09 08:05
关键词:灾备快照容灾

刘 伟

(福建船政交通职业学院信息工程系,福州350007)

0 引言

随着互联网的发展及普及,以应用为核心的信息系统越来越被各行各业所依重。各种行业应用中的业务流程的运转也越来越高度依赖于数据,使得数据成为了支撑企业运作的重要基石。当企业因为信息化带来快捷的服务决策和方便的管理时,也必须面对着数据丢失的危险。数据的丢失会中断企业正常的业务运行,造成巨大的经济损失。除了数据,支撑企业运转的服务器操作系统的保护也变得越来越重要,一旦系统崩溃,将对业务造成严重的影响,给企业带来了严重的威胁。

如何不间断地保护这些数据和系统,保证业务的连续性,各种IT容灾技术及灾备方案应运而生。

1 IT容灾技术

IT容灾的数据复制技术比较多,厂家也很多。总体来说,根据容灾的发起端来进行划分,容灾实现方式可分以下4类,如图1所示。

1.1 存储设备级容灾

存储设备级容灾是通过存储控制器实现的设备级数据远程镜像或复制,是传统容灾方式中最高效最可靠的方式。其优缺点如表1所示。

图1 IT容灾技术分类

表1 存储设备级容灾优缺点

在基于存储级的数据复制技术中,根据主备中心连接的带宽、距离以及中间链路设备和协议转换等因素的考虑,又可采用同步复制和异步复制的方式。其优缺点如表2所示。

主流存储设备厂商都有提供相应的容灾技术,如IBM PPRC、EMC SDRF 、HP CA 等 。

表2 存储设备级容灾同异步复制技术优缺点

1.2 网络级容灾

网络级容灾主要是指基于虚拟存储技术的容灾。通过虚拟化技术整合各种存储、主机设备,支持复制、镜像等主流的容灾技术,用户可以为不同应用灵活选择“最适合”的容灾方案。按照虚拟化管理方式的不同,又可分为带内管理和带外管理。

带内(IN-OF-BAND)管理是指先将服务器接到安装了虚拟引擎的容灾设备上,通过该设备连接到SAN存储网络,然后再连接存储设备。如图2所示,比较典型的带内设计方案有IBM SVC。

图2 带内(IN-OF-BAND)

带外(OUT-OF-BAND)管理是指在不改变已有SAN存储网络的基础上,将容灾设备部署在新的SAN存储链路中,它通过对I/O流量进行监控和数据分离,将容灾数据传到容灾设备中。如图3所示,比较典型的带外设计方案有飞康CDP备份容灾解决方案。

1.3 卷管理级容灾

卷管理级容灾采用卷管理器的磁盘镜像功能来实现。通过在容灾中心主机和生产端主机上安装卷管理器软件,可以将容灾中心的镜像磁盘和生产端的主磁盘上的分区或卷虚拟为服务器能够看到的同一分区或卷,这样在生产端主机发生I/O操作时,系统会自动将数据分别写入生产的主磁盘阵列和容灾中心的镜像磁盘阵列中,从而实现数据的镜像。其中比较典型的是VERITAS的VVR。

图3 带外(OUT-OF-BAND)

1.4 数据库级容灾

基于数据库的容灾方式主要以软件实现为主,包括 Oracle Goldgate、Quest SharePlex 、Realsync、Dsg等收费的第三方产品,以及Oracle Dataguard、Oracle streams等免费产品。这些容灾方式一般是将生产数据库产生的日志应用在容灾的数据库中(除DATAGUARD是完全将生产端产生的日志传送到容灾端外,其它的方式一般先在生产端进行日志分析,提取出有用的信息,再在容灾端应用)。

2 存储CDP技术

2.1 CDP技术定义

CDP(Continuous Data Protection),就是持续数据保护,是2005年国外新兴的一种数据保护技术,它突破了传统的备份/恢复的数据保护模式,通过提供任意时间点的数据恢复能力,为应用提供了更大的灵活性。SNIA数据保护论坛(DMF)的持续数据保护特别兴趣小组(CDP SIG)对CDP的定义是:“持续数据保护是一套方法,它可以捕获或跟踪数据的变化,并将其在生产数据之外独立存放,以确保数据可以恢复到过去的任意时间点。持续数据保护系统可以基于块、文件或应用实现,可以为恢复对象提供足够细的恢复粒度,实现几乎无限多的恢复时间点。”

CDP技术是对传统数据保护技术的一个重大突破。传统的数据保护解决方案专注于对数据的周期性备份上,因此一直伴随有备份窗口、数据一致性以及对生产系统的影响等问题。现在,CDP为用户提供了新的数据保护手段,系统管理者无须关注数据的备份过程,而是仅仅当灾难发生后,简单地选择需要恢复到的数据备份时间点即可实现数据的快速恢复。

2.2 CDP参考模型

参考SNIA的存储共享模型,如图4:

图4 CDP参考模型

可以根据CDP参考模型将实现持续数据保护的产品或解决方案分为如下3类:

(1)基于应用的持续数据保护:对需要保护的关键应用程序,可以在其中直接嵌入和运行CDP功能。这种实现CDP的方式首先能够和应用进行深度整合,确保应用数据在持续保护中的一致性。CDP功能可以由软件厂商将其直接嵌入在软件产品中,也可以是软件厂商提供API接口,由第三方软件开发商来开发完成。

(2)基于文件的持续数据保护:基于文件的CDP,其功能作用在文件系统上。它可以捕捉文件系统数据或者元数据的变化事件(例如创建、修改、删除等),并及时将文件的变动进行记录,以便将来实现任意时间点的文件恢复。

(3)基于数据块的持续数据保护:基于块的CDP功能直接运行在物理的存储设备或逻辑的卷管理器上,甚至也可以运行在数据传输层上。当数据块写入生产数据的存储设备时,CDP系统可以捕获数据的拷贝并将其存放在另外一个存储设备中。基于数据块的数据保护又有基于主机层、基于传输层和基于存储层3类实现方式。

2.3 CDP技术介绍

CDP技术实现主要由以下几大功能和技术来实现。

2.3.1 TimeMark和快照代理技术

利用TimeMark与快照代理功能,通过设置合理的数据快照策略,管理员可以在任何时刻创建一个“TimeMark(时间标记)”,按照事先设定的时间间隔,将指定时刻点的数据视图保存下来。同时快照代理确保数据的完整性,TimeView功能则使应用主机能在瞬间加载过去任意时刻的数据版本,而不必忍受耗时的数据库修复和一致性检查,从而实现最小化的恢复时间目标(RTO)。如果发生误操作、病毒侵袭等事件,导致生产站点的数据错误,通过存储设备上的时间点标记功能就可以回溯并快速恢复到前面某一时刻数据良好的状态点,这个过程在存储设备上可以快速完成,实现数据渐变式灾难的保护。为确保系统数据库恢复的完整性,CDP技术与快照代理(数据代理)技术相结合,无需撰写任何脚本及程序,快照时快照代理可自动与系统和数据库沟通,以确保快照时间点数据的完整性。同时,支持磁盘群组快照,让储存在不同磁盘的数据库与事务日志具有一致性的快照时间点。

2.3.2 复制技术

利用连续或间隔型的复制策略,实现用户系统内的包括系统数据在内的数据连续复制(即可以支持到本地的复制,也可以同时进行到异地的远程复制),以确保灾害发生时,数据恢复到最新的时间点,支持复制內容比对,基于块级的差异复制,复制传输压缩及复制传输加密。

远程复制功能支持在生产中心与灾备中心之间通过IP网络对关键业务数据进行策略性增量复制,实现数据的异地备份,并在发生意外灾难时对数据进行快速恢复,确保用户的业务持续性。

2.3.3 Disksafe技术

面对系统随时崩溃的威胁,我们需要建立一套系统级的保护机制,对应用系统和数据进行有效的保护,防止因意外灾难(包括物理设备受损、OS受损、渐变式灾难等)造成的数据丢失和系统瘫痪,保证灾难发生后能在最短的时间内恢复业务运行。

Disksafe是服务器端的磁盘保护工具,可以即时地监控服务器上的所有系统磁盘和数据磁盘,记录所有磁盘的变化,完整地保护服务器的系统和数据。当系统崩溃或硬盘损坏时可快速实现恢复,直接通过IP网络远程启动操作系统,快速恢复业务应用。当本地硬盘修复后,在线地将系统恢复到已修复好的硬盘上,以恢复本地系统的运行。当不能直接远程启动时,可通过Recovery光盘将存储池中的系统数据恢复到本地修复好的硬盘中,当恢复完成后,业务主机就可以启动恢复应用。

3 全面数据保护的灾备设计

3.1 灾备设计核心思想

评估数据保护及灾备方案的核心指标为RTO和RPO。

RPO(Recovery Point Objective):即数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量。如丢失1小时数据,RPO=1 h。

RTO(Recovery Time Objective):即恢复时间目标,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。如丢失1小时数据,RTO=1 h。

RPO针对的是数据丢失,而RTO针对的是服务丢失,二者没有必然的关联性。RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求来确定,对于不同企业的同一种业务,RTO和RPO的需求也会有所不同。

同时,容灾技术手段的核心思想是:采用合适的数据复制技术,实现数据的远程(同城或异地)传递;采用合适的数据恢复技术,实现业务在各种灾难或需要数据提取时的快速恢复。

3.2 灾备方案设计及优势

基于CDP技术的灾备一体化解决方案,彻底改变了传统的数据备份及灾难恢复方式,全面整合了数据备份、系统恢复、灾难恢复、本地及异地容灾等多项功能。一套方案,完整保护整个信息系统,彻底解决所有传统备份与容灾难题。以最为经济的投资,帮助企业实现最佳的业务连续性目标,提升企业服务水平及客户满意度。CDP系统本地备份及远程容灾架构图,如图5。

图2 CDP系统本地备份及远程容灾架构图

本方案采用的CDP技术体现出几大核心优势:

(1)实现一体化的本地/异地备份与容灾体系。一体化的CDP备份/容灾技术,使任何灾难的发生都不再是致命的,用户很轻松就获得了备份和容灾的双重效果。进行恢复时,用户可以自主选定在本地还是在异地进行,而且其效果远远超过各类传统的灾难保护方式。

(2)全面防御所有灾难,彻底消除灾难死角。从‘软’错误,到‘硬’故障;从单个文件丢失,到站点级灾难,CDP卓越而完备的保护能力,全面覆盖所有灾难,根本没有灾难死角。

(3)瞬间恢复,数据立即可用。CDP使‘恢复’回归到‘立即可用’的本义。任何灾难情况下,CDP基于秒级颗粒的历史恢复能力,使数据可以轻松回到故障前的任何一秒。另外,CDP采用将内在故障与外在故障分层恢复的架构,让大部分常见故障的恢复更加高效。

(4)传输带宽精简。CDP技术还可以利用传输带宽精简技术,使灾备通讯成本大为减少。

(5)多种部署模式,复制策略灵活。用户可以根据自身需求,自由选择部署一种,还是同时部署多种。同时,灵活的复制策略选项,使构建多点对一及多点对多点的数据保护架构更加容易。

(6)全面支持异构存储。CDP技术不仅开放了灾备存储设备的选择,所面向的对象也由集中存储的某些设备扩展到了所有应用系统的各类存储,包括一些DAS和内置存储等。

(7)灾备扩展成本低。CDP技术是一种一次构建,长期受益的技术。未来业务扩展时,无需对基础架构进行改动,扩展成本低廉,充分保护了既有投资。

(8)开放架构,节约成本,充分利旧。全面开放的架构,打破了品牌和技术的限制,全面兼容任何存储、软件及协议,而且可以充分利旧,使既有投资的回报率达到最佳。另外,通过各种精简及压缩技术,存储的成本也削减了超过50%。

CDP技术的一体化灾备与传统灾备方式的优势对比,如表3。

表3 CDP一体化灾备与传统灾备方式的优势对比

4 结语

目前,CDP技术已经成为存储领域所关注的焦点,一些传统的存储备份技术也在悄悄地发生着变化,融入CDP的数据多点快速恢复的元素。对于用户而言,CDP技术完全是应用的要求、是信息化的要求、是服务水准的要求,CDP技术带来的无穷价值毋庸多言,用户从中受到的益处是十分巨大的。越来越多的人在感受着这一点,这也是存储技术发展的技术结晶。以CDP技术为主体的灾备方案将带给用户更理想的RPO和RTO,更好地防御数据丢失、系统瘫痪等巨大的潜在威胁。

[1]康春荣,苏武荣.数据安全项目案例[M].北京:科学出版社,2004:180-200.

[2]王胜航.容灾白皮书[EB/OL].北京:IBM中国信息支持中心,2010.:10:http://wenku.baidu.com/view/32fd545f804d2b160b4ec0d3.html.

[3]颜军.CDP技术—系统安全的更深层保护方法[EB/OL].北京:美国飞康公司,2011.http://www.falconstor.com.cn/products/continuous-data-protector.

[4]王纪奎.成就存储专家之路—存储从入门到精通[M].北京:清华大学出版社,2009:86-101.

[5]张东.大话存储:网络存储系统原理精解与最佳实践[M].北京:清华大学出版社,2008:344-358.

猜你喜欢
灾备快照容灾
EMC存储快照功能分析
一种基于Linux 标准分区的快照方法
关于建筑企业容灾备份系统方案的探讨
创建磁盘组备份快照
基于中兴软交换的电力通信网络容灾系统建设
企业级信息系统应用级灾备建设与应用
轨道交通清分系统灾备升级方案研究
基于数据容灾技术在企业信息系统中的应用研究
深蓝云海“云灾备”正式上线
爱立信HDBSC容灾方案的研究