写点什么

详解集群级备份恢复:物理细粒度备份恢复

  • 2023-05-12
    广东
  • 本文字数:3798 字

    阅读完需:约 12 分钟

详解集群级备份恢复:物理细粒度备份恢复

本文分享自华为云社区《GaussDB(DWS)之物理细粒度备份恢复》,作者:我的橘子呢 。

认识物理细粒度备份恢复


相对于集群级备份恢复海量的文件备份恢复操作,物理细粒度备份能够从更小的粒度、以更少的数据文件操作,对单库、单表进行备份与恢复。在实际使用过程中,数据库集群级的故障并非高概率事件,如何安全高效地帮助客户备份恢复一部分数据库元素,如 schema 或部分表,才是更加实际的需求,这也是细粒度备份恢复的意义所在。


物理细粒度备份以小粒度如 database 级、schema 级、表级等为单位,对数据库文件进行物理备份,由于相对于集群级粒度更小,因此也更加高效实用。目前 Roach 工具支持的物理细粒度备份恢复功能主要包括:schema 级全量备份、schema 级增量备份、从细粒度备份集恢复单表/多表、从集群级备份集(带细粒度参数)恢复单表或多表。这些功能基本上满足了实际使用过程中对细粒度备份恢复的要求。物理细粒度备份恢复功能图如图 1 所示。


图 1 细粒度备份恢复功能示意图

了解物理细粒度备份


物理细粒度的备份能力是从 Roach 的基线版本继承而来的,大部分沿用了集群级备份的设计思路,即基本的备份流程是备份行存文件,创建一致性点,备份 xlog、clog 等文件,最后备份列存文件。物理细粒度备份在此基础上需要进一步考虑以下几个问题。

备份的数据内容


给定对应粒度备份任务如一张表,如何在备份最少数据的情况下保证恢复该表时数据的完整性?考虑该问题需要同时从备份数据小和数据完整性两个方面考虑。备份数据量最小最理想的情况是只备份数据库中该表以及相关表对应的物理文件,同时不考虑数据的拷贝文件,也就是只备份节点中主 DN 对应的数据文件。然而从数据的完整性角度来说,只备份表对应的物理文件是不够的,为了保证恢复阶段能恢复到一致性点,需要依赖 xlog、clog 等日志文件,而这些文件不能以更小的粒度划分,因此需要全部备份。图 2 列出了细粒度备份在保证数据完整性的情况下所必须备份的文件示意图。


图 2 物理细粒度备份数据内容示意图

备份集的存储结构


现阶段集群级备份时会将数据文件和配置文件等压缩进同一个备份的 rch 文件中,在恢复单表时需要一起获取回来并过滤,逻辑较为混乱。因此,为了恢复时能够更精确地获取文件,细粒度备份对数据备份结构进行了进一步改造,将不同类型的文件存储在不同的 rch 文件中,以更小的粒度对存储结构进行了划分。如图 3 所示,行列存相关的文件存储在 data 目录下,以 database 为单位进行了划分,每个 database 目录下存在 row 目录和 col 目录,分别对应存储行存文件和列存文件。archive 文件夹保存 xlog 相关文件,xact 文件存储 clog 相关文件,gloabal 文件夹保存数据目录下其他文件。


图 3 物理细粒度备份存储结构示意图

备份数据相关文件的组织形式


考虑这样一个问题,当备份一张表时,除了备份这张表本身对应的数据文件,我们还应该备份与这张表关联的一些辅助表,比如列存表的 cudesc 表、存在变长字段对应的 toast 表等,只有这样才能保证恢复后这张表的可用性,那么备份的时候怎么知道该表存在哪些关联表呢?细粒度备份采用 Map 文件对表关系进行组织,对表所有的关联表及文件进行统一收集记录。该信息对于细粒度备份恢复至关重要,主要有以下两个方面的作用:


(1)备份时:得到一张表的 Map 信息,在备份行列存文件时,按照 Map 中记录的信息,将表需要备份的相关文件加入到需要备份的 file_list 中,后续备份时就可以按照该 file_list 进行文件的备份,省去了文件的扫描动作。


(2)恢复时:恢复时根据 Map 信息,得到目标表相关的文件记录,就可以对应获取所需的数据文件,并根据表的元信息建立恢复时的路径映射关系。


Map 文件的生成是在备份行存文件之前,各节点以主 DN 个数为单位,并行获取 Map 信息,分别生成自己的 Map 文件。Map 信息的获取,需要从多个 level 进行:Agent –> Instance –> Database –> Schema –>Table –> RelatedRelations


在得到各表对应的 Map 信息后,会按照一定的格式框架组织多层的 json 格式,并将对应的 json 信息以 schema 为单位写入到 schemaname.map 中,最终持久化存储到介质下元数据目录对应的节点级根路径中:/roach/backup_key/map/dn_6001_6002/databasename/schemaname.map


Map 文件对应的 json 存储内容如图 4 所示。


图 4 Map 文件 Json 格式

备份压缩文件与数据文件的映射关系


考虑细粒度恢复一张表时,如何在备份集大量的 rch 压缩文件中挑选出我们想要的表在哪些 rch 文件里。细粒度备份恢复在备份过程中会生成额外的 fine_file_list 信息,每张 rch 文件都有一个 fine_file_list 文件与之相对应。该 fine_file_list 文件记录了对应 rch 文件中保存了哪些表,在恢复时就可以根据 fine_file_list 找到待恢复表涉及哪些 rch 文件,精准获取必要的 rch 文件,这样就可以大幅提升细粒度恢复的性能。


只有行列存数据的 rch 文件存在对应的 fine_file_list 文件。fine_file_list 保存在节点元信息目录下对应的文件夹中:  /roach/backup_key/fine_file_list/dn_6001_6002/row/file_0_fine_list  /roach/backup_key/fine_file_list/dn_6001_6002/col/file_0_fine_list

备份表定义导出文件


细粒度恢复是在线进行的,在进行单表或多表恢复时需要创建出与原表定义相同的表,再进行表物理文件的替换,这就必须知道原表的 DDL 元信息。因此,在备份过程中需要同时导出各个表的 DDL 元信息。物理细粒度备份恢复利用的 GaussDB(DWS)自带的 gs_dump 工具对表定义进行导出。由于该信息只用于恢复过程,因此在细粒度备份刚开始时会启动 gs_dump 去导出所有的表的 DDL 信息,并让备份过程与 DDL 导出并行,不需要阻塞等待,减少整体物理细粒度的备份时间。DDL 导出流程如图 5 所示。


图 5 导出 DDL 流程图


导出的 DDL 信息以 schema 为单位存储在节点元信息目录下对应的文件夹中:   /roach/backup_key/dumped_ddl/databasename.schemaname

物理细粒度备份整体流程


经过以上介绍,细粒度备份的关键步骤都已经清楚了,下面给出细粒度备份的整体流程图,如图 6 所示。


图 6 物理细粒度备份流程图

了解物理细粒度恢复


与集群级恢复停止集群进行数据覆盖的方式不同,细粒度恢复采用在线恢复的方式,该方法的核心思想就是在当前集群中创建与原表定义完全相同的目标表,再将两张表相关的物理文件进行一一替换。细粒度恢复的方法能够在线进行,对现有集群影响较小,但同时也对恢复过程数据的控制有了更高的要求。


物理细粒度恢复的大致流程如图 7 所示。


图 7 物理细粒度恢复流程图

使用物理细粒度备份恢复


GaussDB(DWS)的 Roach 工具现阶段支持 schema 级的物理细粒度备份,下面介绍如何发起物理细粒度备份以及如何从细粒度备份集中恢复一张表。

获取物理细粒度备份集


Roach 工具现支持 schema 级的细粒度备份,如下为命令行中发起 schema 级物理细粒度备份的命令:


图 8 发起 schema 级备份


以下参数为必选参数:


  • –master-port : 进程端口号

  • –media-type : 存储介质

  • –media-destination : 压缩数据存储路径

  • –metadata-destination : 元数据存储路径

  • –dbname : 数据库名称

  • –schema-list : 多 schema 清单文件名,内容格式为每行一个 schema 名

  • –physical-fine-grained : 物理细粒度参数


其中指定 schema 清单时如果只有一个 schema,也可以直接使用–schemaname 参数直接指定需要备份的 schema 名称,此外,同时备份多个 schema 时,schema 需要在同一个 database 下。


除了 schema 级别备份,为支持从集群级备份集中细粒度恢复单表或多表,可以通过在集群级命令中加入物理细粒度参数:–physical-fine-grained 来生成细粒度恢复需要的 Map 文件、fine_file_list 信息。如下为集群级带细粒度参数的命令:


图 9 集群级备份带细粒度参数


需要说明的是,带细粒度参数的集群级备份依然是集群级的,只是为支持从该备份集细粒度恢复单表生成了额外的细粒度相关文件。

从物理细粒度备份集恢复表


Roach 工具现支持从细粒度备份集或(集群级带细粒度参数备份集)恢复单表或多表,假如当前数据库用户不小心删除了一张表,又不想对停止业务对整个集群进行恢复,如果之前做过物理细粒度相关备份,备份集中有这张表,那么细粒度恢复就是最好的选择。细粒度恢复可以在线进行,不影响集群的正常使用,发起细粒度恢复的命令如下:


图 10 细粒度恢复表命令


以下参数为必选参数:


  • –clean

  • –master-port

  • –media-type

  • –media-destination

  • –metadata-destination

  • –backup-key : 恢复基于的备份集

  • –physical-fine-grained : 物理细粒度参数

  • –dbname : 数据库名称

  • –table-list : 待恢复表列表,格式为 schemaname.tablename

  • –restore-target-list : 恢复后表列表,格式为 schemaname.tablename


其中–table-list 指定了需要恢复的哪些表,–restore-target-list 指定了恢复后表的名称,要求–restore-target-list 的表顺序与–table-list 的表顺序一一对应。如果要全部恢复到原表,则这两个表清单可以指向相同文件。两个表清单参数对应的文件内容格式是:每个表一行,且必须带 schema 名。

总结


细粒度备份和恢复以更小的粒度对数据文件进行了备份恢复操作。考虑到备份数据的完整性以及备份恢复的性能,细粒度备份过程增加了 ddl 导出、Map 文件生成等关键步骤,其中从数据目录下的物理文件信息到 Map 信息、再从 Map 信息到备份的 rch 文件对应的 fine_file_list 信息,形成了对备份数据文件连续的记录链条。恢复过程中如果出现缺少数据的情况,可以通过对备份过程中以上所说信息的互相对比快速定位到出现问题的环节,因此,掌握以上信息十分关键,可以帮助我们更好地使用细粒度备份恢复功能。


点击关注,第一时间了解华为云新鲜技术~

发布于: 刚刚阅读数: 4
用户头像

提供全面深入的云计算技术干货 2020-07-14 加入

生于云,长于云,让开发者成为决定性力量

评论

发布
暂无评论
详解集群级备份恢复:物理细粒度备份恢复_数据库_华为云开发者联盟_InfoQ写作社区