所谓数据容灾,就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个可用复制。在本地数据及整个应用系统出现灾难时,系统至少在异地保存有一份可用的关键业务的数据。该数据可以是与本地生产数据的完全实时复制,也可以比本地数据略微落后,但一定是可用的。采用的主要技术是数据备份和数据复制技术。
王建成的小结:比数据容灾完备得多,本地业务安全(LB、Cluster、热备等)+数据容灾(远程复制=镜像、备份)+广域网安全(诊断+切换能力)=各个环节的系统安全可靠
容灾备份是通过在异地建立和维护一个备份
存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。
根据
容灾系统对灾难的抵抗程度,可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统,该系统是对本地系统关键应用数据实时复制。当出现灾难时,可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高,即在异地建立一套完整的、与本地数据系统相当的备份应用系统(可以同本地应用系统互为备份,也可与本地应用系统共同工作)。在灾难出现后,远程应用系统迅速接管或承担本地应用系统的业务运行。
设计一个
容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、
应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。根据这些因素和不同的应用场合,通常可将容灾备份分为四个等级。
第0级:没有备援中心
这一级
容灾备份,实际上没有灾难恢复能力,它只在本地进行数据备份,并且被备份的数据只在本地保存,没有送往异地。
第1级:本地磁带备份,异地保存
在本地将关键数据备份,然后送到异地保存。灾难发生后,按预定
数据恢复程序恢复系统和数据。这种方案成本低、易于配置。但当数据量增大时,存在存储介质难管理的问题,并且当灾难发生时存在大量数据难以及时恢复的问题。为了解决此问题,灾难发生时,先恢复关键数据,后恢复非关键数据。
第2级:热备份站点备份
在异地建立一个热备份点,通过网络进行数据备份。也就是通过网络以同步或异步方式,把主站点的数据备份到备份站点,备份站点一般只备份数据,不承担业务。当出现灾难时,备份站点接替主站点的业务,从而维护业务运行的连续性。
第3级:活动备援中心
在相隔较远的地方分别建立两个数据中心,它们都处于
工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入资金的多少,又可分为两种:
1、两个数据中心之间只限于关键数据的相互备份;
2、两个数据中心之间互为
镜像,即零数据丢失等。零数据丢失是目前要求最高的一种
容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的
管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是最快的。
在建立
容灾备份系统时会涉及到多种技术,如:SAN或NAS技术、远程
镜像技术、基于IP的SAN的互连技术、
快照技术等。这里重点介绍远程
镜像、快照和互连技术。
远程镜像技术
远程镜像技术是在主数据中心和备援中心之间的数据备份时用到。
镜像是在两个或多个磁盘或磁盘子系统上产生同一个数据的镜像视图的信息
存储过程,一个叫主镜像系统,另一个叫从镜像系统。按主从镜像
存储系统所处的位置可分为本地镜像和远程镜像。
远程镜像又叫远程复制,是
容灾备份的核心技术,同时也是保持远程
数据同步和实现灾难恢复的基础。远程镜像按请求镜像的主机是否需要远程
镜像站点的确认信息,又可分为同步远程镜像和异步远程镜像。
同步远程镜像(同步复制技术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O
事务均需等待远程复制的完成确认信息,方予以释放。同步
镜像使拷贝总能与本地机要求复制的内容相匹配。当主站点出现故障时,用户的应用程序切换到备份的替代站点后,被镜像的远程副本可以保证业务继续执行而没有数据的丢失。但它存在往返传播造成延时较长的缺点,只限于在相对较近的距离上应用。
异步远程镜像(异步复制技术)保证在更新远程存储视图前完成向本地
存储系统的基本操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息。远程的数据复制是以后台同步的方式进行的,这使本地系统性能受到的影响很小,传输距离长(可达1000公里以上),对
网络带宽要求小。但是,许多远程的从属存储子系统的写没有得到确认,当某种因素造成数据传输失败,可能出现
数据一致性问题。为了解决这个问题,目前大多采用延迟复制的技术(本地数据复制均在后台日志区进行),即在确保本地数据完好无损后进行远程
数据更新。
快照技术
快照是通过软件对要备份的磁盘子系统的数据快速扫描,建立一个要备份数据的快照逻辑单元号LUN和快照cache。在快速扫描时,把备份过程中即将要修改的
数据块同时快速拷贝到快照cache中。快照LUN是一组指针,它指向快照cache和磁盘子系统中不变的数据块(在备份过程中)。在正常业务进行的同时,利用快照LUN实现对原数据的一个完全的备份。它可使用户在正常业务不受影响的情况下(主要指
容灾备份系统),实时提取当前在线业务数据。其“
备份窗口”接近于零,可大大增加系统业务的连续性,为实现系统真正的7×24运转提供了保证。
快照是通过内存作为缓冲区(快照cache),由快照软件提供系统磁盘存储的即时数据映像,它存在缓冲区调度的问题。
互连技术
早期的主
数据中心和备援数据中心之间的数据备份,主要是基于SAN的远程复制(
镜像),即通过
光纤通道FC,把两个SAN连接起来,进行远程镜像(复制)。当灾难发生时,由备援数据中心替代主数据中心保证系统工作的连续性。这种远程
容灾备份方式存在一些缺陷,如:实现成本高、设备的互操作性差、跨越的地理距离短(10公里)等,这些因素阻碍了它的进一步推广和应用。
目前,出现了多种基于IP的SAN的远程数据容灾备份技术。它们是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备援中心SAN中。当备援中心存储的数据量过大时,可利用
快照技术将其备份到
磁带库或
光盘库中。这种基于IP的SAN的远程
容灾备份,可以跨越LAN、MAN和WAN,成本低、可扩展性好,具有广阔的发展前景。基于IP的互连协议包括:FCIP、iFCP、Infiniband、iSCSI等。
第四章:应用技术编辑
应用级容灾技术,不仅仅可以保障数据安全,更主要的是能确保业务系统7*24小时持续运行。
美创DBRA应用级容灾系统,通过挖掘日志、应用日志的形式实现数据的异地实时同步,通过自动或一键式全业务切换来确保,业务连续性。
美创DBRA主要有以下几个特点:
支持全业务的切换
DBRA是业界第一个以整个业务系统为视角进行组织和管理的软件技术,可用实现包括应用、中间件和数据库系统的一键式容灾切换。实现0数据丢失,分钟级切换。在灾难带来的巨大恐慌的时刻,避免人工出错和降低RTO,使RTO可控。
支持双活数据中心,容灾端数据实时可用
DBRA容灾端的数据库提供只读查询的功能,使客户的部分业务可以迁移到容灾端进行,减少生产端的压力。另外用户可以随时校验数据的有效性。
具有闪回机制,可以防范人为误操作
DBRA对于发生频率比较高的误操作也可以很好的防范。可以做到基于数据库、表空间、表格等任意粒度的闪回,帮助用户快速的找回误删除的数据。
灾备一体化
DBRA用一套软件可以同时实现容灾和备份的功能,避免了分别建设容灾和备份系统的重复性投资。DBRA的备份是真正的实时备份,备份数据随时可用。避免了传统备份无法解决的备份窗口问题和数据丢失问题。同时备份数据的随时可用,大大减少了业务系统的停机时间。
容灾的完备性
灾难是多种多样的,如:地震、火灾、电力故障、人为误删除、病毒、黑客入侵等等。灾难一般可以分为物理错误和逻辑错误。DBRA对于物理错误和逻辑错误都能进行很好的防范。
第五章:其他
技术指标
RPO(Recovery Point Objective):即
数据恢复点目标,主要指的是业务系统所能容忍的数据丢失量。
RTO(Recovery Time Objective):即恢复时间目标,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。
RPO针对的是数据丢失,而RTO针对的是服务丢失,二者没有必然的关联性。RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。对于不同企业的同一种业务,RTO和RPO的需求也会有所不同。
现状
从去年后半年的一次调查结果来看,每个公司都开始非常认真的应对灾难。该调查结果显示,有74%的受访者称他们所在的公司已经有了灾难应对方案,这个数值比早先的一些调查结果高。有48%的受访者表示他们正在对此进行规划。另外有52%的人表示他们的灾备中心是属于他们自己公司的,而29%的受访者表示他们的灾备中心是租来的。仅有11% 的人将他们的灾备中心放在云服务提供商那里进行托管。
而在两年前的一项调查中,54%的受访者表示他们的每两年会定期测试一下他们的灾备计划,而现在这项指标降为了47%,另外有21%的人表示每年会进行演练而还有24%的受访者说他们并无定期的灾备演练计划,而这是一项随时可能发起的演习。不管演习的频率是怎样的,80%的人表示他们期望应用在24小时内
恢复回来,能快速恢复回来当然是不错的,因为其中有42%的人说他们不能丢失任何的数据。
受访者同样表示他们现在越来越能接受灾备规划,同时也表达了他们对云服务的担忧。但有人也表达了些他们自己的看法,因为他们的数据从来没有被恢复过。[3]
常用数据容灾软件编辑
Acronis Backup & Recovery 可备份和恢复 Windows 或 Linux 服务器。它提[4]
供基于磁盘的备份、灾难恢复与数据保护,支持磁盘、磁带或云端存储选项、目录、搜索,以及集中管理。
Moebius for SQL Server提供了数据库层面基于事务的双活技术、灾难恢复与数据保护。