云环境中的灾备规划与分析
1、数据分析
对于企业来说,最重要的 IT 信息资产就是数据。从数据用途的角度来分析,可将需要备份的数据分为系统数据、基础数据、应用数据和临时数据;同时根据数据存储和管理的方式可分为数据库数据、非数据库数据、孤立数据和遗失数据。
1)按数据用途划分,需要备份的数据可分为:
系统数据:主要是指操作系统、应用系统安装的各类软件包和应用系统执行程序。系统数据在系统安装后基本上不再变动,只有在操作系统、应用系统版本升级或应用程序调整时才发生变化。
基础数据:主要是指保证业务系统正常运行所使用的系统目录、用户目录、系统配置文件、网络配置文件、应用配置文件、存取权限控制等。基础数据随业务系统运行环境的变化而变化,一般作为系统档案进行保存。
应用数据:主要是指业务系统的所有业务数据,对数据的安全性、准确性、完整性要求很高,而且变化频繁。
临时数据:主要是指操作系统、应用系统、数据库产生的系统运行记录、数据库逻辑日志,以及应用程序在执行过程中产生的各种打印、传输临时文件,随系统运行和业务的发生而变化。临时数据对业务数据的完整性影响不大,增大后需要定期进行清理。
2)按数据存储和管理的方式划分,需要备份的数据又可以分为:
数据库数据是指通过数据库软件或数据库管理系统来进行存取和管理的数据。
非数据库数据是指通过文件等非数据库管理系统来进行存取和管理的数据。
孤立数据是指从最后一次业务数据备份后到灾难发生、系统运行停止前未进行灾难备份的数据。这部分数据通常需要通过人工等方法重新录入系统。一般情况下,孤立数据越多,系统恢复的时间就越长,业务的停顿时间也就越长。孤立数据的多少与数据备份的周期有很大关系。
遗失数据是指无法恢复或重建的数据。在灾难备份系统的设计与实施中,要重点考虑的就是防止遗失数据的产生或减少遗失数据的数量,以及如何快速查找遗失数据等。
通过数据分析,我们可以对将要备份的数据有一个比较清楚的认识,保护好关键的应用数据和数据库数据,同时减少孤立数据和遗失数据。
2、业务分析
在企业里有不同的业务场景,我们可以根据各种业务系统处理的业务类型、数据存储方式、处理方式、实时性要求、每天处理的业务量、单位时间内处理的业务量等条件,将业务系统划分为关键业务系统、重要业务系统和一般业务系统等。
关键业务系统:业务数据比较集中和核心,所连服务器节点较多,对保证整个企业的正常运转至关重要;一旦业务中断,则企业提供的服务及正常业务运作将受到相当严重的影响。并且在特殊时期如月末、年末、业务量高峰期中断造成的影响更大,不仅经济损失大,企业信誉降低,而且有可能要承担潜在的法律责任。
重要业务系统:业务中断将对整个企业的正常、有效运转产生较严重的影响。一旦业务发生中断,企业提供的部分服务及部分业务会受到影响和中断,但无关大局。比如:内部企业网系统、邮件传输系统、报表业务处理系统等。
一般业务系统:业务中断将不会立刻对整个企业的正常运转产生严重影响,一旦中断可以容忍在数天或数周内恢复。比如:人事档案系统、考勤系统、工程预决算系统等。
业务中断持续时间愈长,损失愈大。不同的时期如月末、年末、业务高峰期中断也是造成灾难损失的一个重要时间因素,且业务种类不同,造成的损失也不同。我们尽可能全力保护关键和重要业务系统的高可用,并降低业务恢复所需的时间来减少企业的损失。
3、灾备中的技术分析
目前有很多种容灾技术,分类也比较复杂,但总体上可以区分为离线式容灾(冷容灾)和在线容灾(热容灾)两种类型。
1)离线式容灾
所谓的离线式容灾主要依靠备份技术来实现。其重要步骤是将数据通过备份系统备份到磁带,而后将磁带运送到异地保存管理(还可使用虚拟带库技术,可提升备份恢复的性能和速度)。离线式容灾具有实时性低、可备份多个副本、备份范围广、长期保存、投资较少等特点,由于备份基于压缩后存放到磁带的方式,所以数据恢复较慢,而且备份窗口内的数据都会丢失,因此一般用于对数据恢复的 RTO(目标恢复时间)和 RPO(目标恢复点)要求较低的容灾。也有很多客户将离线式容灾和在线容灾结合起来以增加系统容灾的完整性和安全性。
目前主流的备份软件主要有:Symantec Veritas NetBackup、EMC Legato NetWorker、IBM Tivoli Storage Manager 和 Quest BakBone NetVault。
2)在线容灾
在线容灾要求生产中心和灾备中心同时工作,生产中心和灾备中心之间由传输链路连接。数据自生产中心实时复制传送到灾备中心。在此基础上,可以在应用层进行集群管理,当生产中心遭受灾难、出现故障时可由灾备中心接管并继续提供服务。因此实现在线容灾的关键是数据的复制。与数据备份相比,数据复制技术具有实时性高、数据丢失少和容灾恢复快、投资较高等特点。根据数据复制的层次,数据复制技术的实现可以分为三种:基于存储的数据复制技术、基于主机的数据复制技术和基于数据库的数据复制技术。
基于存储的数据复制技术:国内常见的容灾解决方案,由存储厂家提供技术实现生产中心存储设备与灾备中心存储设备的直接远程镜像,将数据以同步或异步的方式复制到远端。其优点是将数据与应用分开,对主机系统的运行资源影响比较小,缺点是必须在本地端和灾备端分别配置两套相同的存储系统。
基于主机的数据复制技术:通过安装在服务器上的数据复制软件,实现异地数据复制。该技术的优点在于成本相对较低且能兼容不同厂家的存储设备,缺点是会占用主机的系统资源。
基于数据库的数据复制技术:基于数据库的容灾技术传输的是数据库指令或者重做日志文件。该技术与存储类型和服务器平台无关,具有较好的使用灵活性。比如 Oracle 中的 DG 技术,DB2 中的 HADR 技术,MySQL 中的主从复制。
版权声明: 本文为 InfoQ 作者【穿过生命散发芬芳】的原创文章。
原文链接:【http://xie.infoq.cn/article/c0c24cf12d863b4268f29cb03】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论