企业在数字化与信创转型的双重驱动下,私有云解决方案成为构建企业信息化基座的重要方案之一,而灾备解决方案作为企业的生命线是私有云建设过程中重要环节之一。灾备(Disaster Recovery)指的是容灾与备份结合,利用IT技术对企业数据、业务高可用进行保护,确保系统遭受灾难时数据安全、业务快速恢复。
对于业务的安全性,安超私有云解决方案可为企业业务提供全局的安全保障方案,建设城域内、城域间的备份与容灾保护体系。其中包含了超融合架构自身的安全性保障方案与基于超融合架构的备份、容灾方案(如下图),本篇文章将重点介绍容灾备份解决方案部分。
容灾备份方面,安超云为企业提供满足不同安全级别的容灾与备份解决方案,包含备份与恢复方案、安超(异地)站点容灾方案、VMware站点(异地)容灾方案、同城双活数据中心方案、以及基于业务的FT容错保护方案,这些方案在保障业务数据的安全性同时,也可为业务的持续运行提供最大保障,企业可以根据自身业务重要性进行方案定制。
01备份与恢复方案是采用的基于安超超融合的定时备份功能,该功能除了基础软件授权外,无需额外的软件及空间授权,且不限制备份虚拟机的数量。该备份与恢复方案采用无代理方式,虚拟机端无需安装任何代理程序,用户按需选择单一业务VM备份或采用批量方案进行备份任务,基于预先定义好的策略自动执行或手动执行,最小时间策略为15分钟(RPO=15分钟),在需要进行恢复时根据待恢复备份点进行一键拉起。
对于备份目标,安超云管理平台支持多种备份目标种类,支持将虚拟机、虚拟磁盘备份到外部对象存储(公有云、本地存储)、NAS存储设备,用户可根据情况进行选择。
该方案针对人为误操作、恶意行为(删库)、勒索病毒、逻辑错误等问题导致的数据损坏或丢失,可通过备份数据进行一键恢复。也可通过备份数据进行数据迁移,在源集群对数据备份后,再到目标集群中进行恢复。
集成简单化:集成于安超平台中,无需购买第三方灾备软件,操作简单易上手,无学习成本,是虚拟机级别的备份方案。
无代理在线备份:要备份的虚拟机,无需安装任何代理,对用户业务系统无侵入性,适用于大规模备份场景,降低备份运维的复杂度。
数据稳定性:提供断点续传、加密传输、压缩传输技术。
备份高效性:使用空洞数据识别、增量备份等方式减少备份窗口,降低存储空间占用。
数据安全性:备份数据分片进行保存,仅灾备中心可以进行数据解析,保障数据安全。
虚拟机备份方式支持虚拟机全量备份和增量备份(平台内部备份机制,页面不可设置),两种备份方式都仅备份虚拟磁盘精简容量(实际使用容量)。首次备份为全量备份,备份保留周期内其他备份为增量备份,保留时间超过备份保留周期(即备份保留时间)的增量备份会与虚拟机全量备份合并为新的全量备份。如果更换备份位置,系统会重新为虚拟机做一次全量备份。备份策略支持用户手动备份和系统自动备份。手动备份适用于业务虚拟机较少、业务虚拟机需要立即备份的场景,系统自动备份适用于需备份虚拟机规模较大、且需要定期执行的场景。
对于备份到对象存储空间,全量备份任务会先进行读取快照数据,并进行数据分片,每个数据分片大小为32KB,读取后再合并成1MB大小的数据块,通过对象备份服务器写入对象存储空间。对于增量备份任务,会先在已有快照的基础上再创建快照,并进行数据分片,读取新快照上的新增数据分片,把增量数据分片合成1MB的数据块,最后将数据保存到对象存储空间中。
对于备份到NAS存储空间,备份数据在NFS存储上是以精简文件格式存放,从单个虚拟磁盘来看,每个精简文件对应一个备份点。每次备份任务,将会创建备份点文件,把虚拟磁盘的增量数据写入该备份点文件中。在进行虚拟机恢复任务时,先在ArStor存储上创建raw格式虚拟硬盘(SAN和本地存储上为qcow2 ),把备份文件、备份数据回写成raw或qcow2格式。同时,NFS存储上以文件的形式保存了备份信息,NFS存储再次被加为站点时,备份软件能够自动加载备份信息,支持跨集群恢复虚拟机。
02安超(异地)灾备方案是为了保证在站点灾难后业务可以在容灾站点进行快速恢复,保证业务系统最短的中断时间,该方案是基于ArStor分布式存储的数据复制技术实现,在两个安超(集群)ArStor存储间进行基于时间策略的异步数据复制,灾备任务可以在源站点(受保护站点)发生灾难后在目标站点(恢复站点)进行恢复,实现业务VM快速拉起,安超灾备方案RPO最小为15分钟,RTO约等于2-3分钟。
容灾站点间要求网络可达即可,可以是VPN专用网络、本地网络或其他网络。网络带宽要保证在设置的时间策略下,完成数据的复制任务即可。
该方案适用于机柜间灾备、数据中心间灾备、园区间灾备、跨城灾备建设。
集成简单化:集成于安超平台中,无需购买第三方灾备软件,操作简单易上手,无学习成本,是虚拟机、虚拟磁盘级别的备份容灾方案。
无代理在线备份:要备份的虚拟机、虚拟磁盘,无需安装任何代理,对用户业务系统无侵入性,适用于大规模备份场景,降低备份运维的复杂度。
保证业务连续性:存在着生产就绪的恢复站点,受保护站点故障时,可以在恢复站点快速恢复(2~3分钟),减少业务中断时间,保障业务连续性。
生产应用无影响:采用无损快照技术,数据备份过程对生产应用无影响。
备份高效性:采用空洞数据识别、增量备份等方式减少备份窗口,降低存储空间占用,采用最小4KB粒度的差异数据比较,备份更加高效可靠。
LAN-FREE备份:通过存储网络进行数据传输,降低灾备过程对管理、业务网络压力。
数据可靠性:备份数据以双副本或三副本的方式存放,保障备份数据可靠。
减少空间占用:在ArStor上的备份数据可以进行压缩,减少空间占用,最大压缩率66%。
灵活扩容:基于ArStor的恢复站点,最小2节点起步,支持横向扩容至3节点和多节点,以应对日益增长的备份数据压力。
费用集约:功能授权按需要容灾的VM数量进行按需授权,非全局授权,建设费用有效可控。
安超超融合集群间容灾,恢复站点通过存储网络的iSCSI协议读写ArStor存储上的虚拟磁盘,不额外消耗生产集群的CPU、内存资源,未使用管理、业务网络进行灾备数据传输,灾备体系的建设不影响受保护站点的性能和稳定性。
如上图所示,存在多个安超超融合集群被安超云管理平台纳管情况,其中一个安超超融合集群作为容灾恢复站点,另外两个或多个安超超融合集群作为受保护站点。通过ArcherOS API(管理网络)申请受保护站点存储的访问权限,通过iSCSI接口(存储网络)进行快照间数据的增量复制,iSCSI连接采用CHAP认证和IPSec加密传输,以保证数据传输过程中的安全性。对于全量备份任务,会在恢复站点创建一块虚拟磁盘,通过iSCSI协议读取受保护站点磁盘数据,并把受保护站点的磁盘数据写入该虚拟磁盘中。对于增量备份任务,恢复站点会创建快照,通过iSCSI协议读取受保护站点上的增量数据,并把受保护站点虚拟磁盘快照间的增量数据写入恢复站点的快照中。另外在备份过程中,可以选择在受保护站点保留备份快照,以提高受保护站点的恢复效率。在进行(受保护站点)恢复任务时,恢复站点读取备份数据通过iSCSI协议写入受保护站点的磁盘中,进而完成业务的恢复任务。
03VMware灾备方案同上文安超灾备方案都采用数据异步容灾方案,在安超云管理平台纳管VMware平台后,可以配置VMware平台到安超平台的容灾策略,按需将VMware平台虚拟机磁盘数据备份到安超平台存储,实现VMware虚拟机在安超平台恢复,恢复到安超平台的虚拟机还可以一键拉回VMware平台,该方案RPO最小为15分钟,RTO约等于2-3分钟。
该方案适用于VMware集群容灾建设、VMware平台替换方案(通过该方案将VMware虚拟机迁移到安超平台)。
方案亮点:该方案亮点与安超站点灾备方案基本一致,除此之外该方案还可以做为VMware替代转型的一种迁移方案,实现将VMware虚拟机一键批量迁移到国产化平台,加速整个VMware转型进程。
执行容灾任务后,会建立VMware到安超平台的磁盘数据备份任务,先通过vSphere API接口调度VMware虚拟磁盘创建快照点。
基于快照点,首先进行全量备份,将VMware虚拟磁盘全量备份到安超ArStor存储,在安超平台会创建与VMware平台同样大小的虚拟磁盘,通过VDDK(Virtual Disk Development Kit)读取快照间的差异数据,利用offset 、length的方式进行数据的多次读取,通过数据通道(data channel)把数据写入安超平台创建虚拟磁盘。
增量备份过程,完成全量备份后,建立虚拟磁盘快照点,将快照间的增量数据备份到安超ArStor存储虚拟磁盘快照中(详细过程同全量备份)。
恢复虚拟机,在安超平台基于备份数据恢复虚拟机,基于ArStor存储中备份的虚拟磁盘执行快照,把系统盘进行V2V转换(注入VirtIO驱动),然后基于系统盘创建虚拟机,并挂载其它数据盘,安装VMtools后启动虚拟机,完成整个容灾切换过程。
04安超双活数据中心方案是在两个站点(数据中心、楼宇、园区等城域内站点)间部署跨站点的安超超融合集群来构建双活数据中心,建立双活关系(Active-Active)。副本数据在两个超融合站点之间相互实时复制同步。同时,两个站点超融合能够同时运行业务系统,对外提供业务服务,构建AA级别双活能力。当任意一个站点由于意外灾难导致超融合集群不可用,业务能够立刻执行跨站点高可用切换到另外一个站点继续运行,并且做到数量零丢失(RPO=0),业务最短中断(RTO=2-3分钟)。
请阅读《一文了解安超延伸集群如何为企业打造站点容灾能力》了解具体细节。
05FT容错是保障业务高可用的方案,提供比HA、双活集群更高的业务连续性级别,让业务应用一直在线运行,实现数据“零”丢失,业务“零”中断。FT容错技术通过创建、维护与主VM完全一样的备用VM,主VM实时提供对外部的访问服务,备VM对外部保持静默状态,并于主VM实时同步内存状态与存储状态,保持信息的一致性。
在发生故障时(断电、硬件故障导致的节点不可用),备用VM立刻被激活并切换为主VM,所有关于VM状态信息都会完成的保留,来为业务继续提供连续的可用性。与此同时,新的备用VM会被再次创建,继续同步内存状态、存储状态,维护主备关系,可为大多数关键业务配置FT容错。
FT容错方案最大化保证了业务的连续型,在功能上存在一些限制,具体如下。
仅支持本地存储与SAN存储,不支持热迁移和跨存储迁移。
该方案主要适用于要求业务无中断场景,如电子政务系统、身份识别、通信系统、报名系统等。
持续保障业务高可用性:实现数据“零”丢失,业务“零”中断。
业务完全无感知:整个FT容错切换、建立过程对业务系统完全透明 。
持续FT容错:源主备VM切换后,会继续建立新的主备关系,继续保证高可用。
更低的投入:经济性,不依赖操作系统和应用,减少不必要的容灾软件投资。
配置简单、易维护:学习成本低,缩短配置时间,且易于维护。
灾备方案是私有云建设中的重要环节,所有企业都应选择适合的灾备方案,做到有备无患,在满足法律法规的同时,也可保障业务安全。安超云提供从数据备份到业务容灾的多样化建设方案,且已经在多个行业中有落地应用案例,后续文章将对客户成功案例进行深度解析,敬请期待。