将 AWS S3 数据迁移至 TiDB Cloud 集群
一、文档目的
在使用 TiDB Cloud 过程中,通常大家面临的第一个难题便是如何将现有集群的数据导入至 TiDB Cloud 集群中,”很幸运“地是 TiDB Cloud 上提供了多种方式可以帮助大家完成这一过程,大家可以自行到官网上查看。本文档提供了将 AWS S3 中数据导入至 TiDB Cloud 集群的操作步骤,供大家参考。
说明:目前在免费的 TiDB Cloud Dev Tier 集群中, Web 界面导入的数据源仅支持 AWS S3 ,支持的数据格式有 4 种:TiDB dumping、Aurora Backup Snapshot、CSV 和 Parquet,本次测试模拟将 AWS S3 中 dumpling 格式的数据导入至 TiDB Cloud 集群,其他的数据格式也是类似方式。
二、在 TiDB Cloud 上创建测试集群
1. 选择免费的 “Developer Tier”
data:image/s3,"s3://crabby-images/f07c1/f07c1c9e773dc2042d0546349cc149c09b96be21" alt=""
2. 创建测试集群
data:image/s3,"s3://crabby-images/189b7/189b72f147da8a1211d2895d0c5574d0ac4be5c3" alt=""
data:image/s3,"s3://crabby-images/03a30/03a30e5900aeaffdf92c3561499b360c41511350" alt=""
3. 集群创建成功后,设置本地标准连接
(1)选择 Overview -》 选择 Connect -》 Standard Connection
data:image/s3,"s3://crabby-images/471f9/471f90f34828c6ea66520b5135db8fe965cf59cb" alt=""
(2)添加本地 IP 地址
data:image/s3,"s3://crabby-images/133a4/133a4d37af5113d8dcdd2f4388e4fa1295aebca1" alt=""
(3)测试本地连接成功
data:image/s3,"s3://crabby-images/bc8c2/bc8c2b4b8ed62c2de885db170a0444341894ff23" alt=""
三、在 AWS S3 上创建 bucket 并设置权限
1. 在 AWS 中创建 S3 bucket ,并上传 dumpling 导出的文件
(1)获取 s3 bucket 的 ARN (arn:aws:s3:::dumplingtest),后面在 AWS IAM 中创建策略会用到(创建 bucket 过程省略)
data:image/s3,"s3://crabby-images/ccc8c/ccc8c7a8fd74c7c989c9b5237d91f03bcbf3fe11" alt=""
(2)在 s3 bucket 中上传 dumpling 工具导出的数据文件(过程省略),放到子目录 testdata 下
说明:测试数据来源为本地集群通过 dumpling 工具导出的 SQL 文件
data:image/s3,"s3://crabby-images/2fc19/2fc199d17c5b9eedcb94c4a21a16cc7afd92f6a3" alt=""
data:image/s3,"s3://crabby-images/45e1a/45e1aae29b8026c7ef0343689e1286d6d61288e9" alt=""
2. 在 AWS IAM 中创建访问 S3 桶的 policy
(1)创建策略,编写策略规则
填写 S3 bucket 的 ARN 信息: arn:aws:s3:::dumplingtest
权限 s3.GetObject 、s3.GetObjectVersion 和 s3 bucket 中子目录对应
权限 s3.ListBucket 、 s3.GetBucketLocation 和 s3 bucket 对应
data:image/s3,"s3://crabby-images/d4f64/d4f6453f44b7043b60902ed15ec1832777bf0c36" alt=""
data:image/s3,"s3://crabby-images/26b86/26b86a4c4067eb5ba7f5d69e39d8ce07f9bf10c0" alt=""
(2)策略创建成功
data:image/s3,"s3://crabby-images/62f34/62f34b0bb30bec0eaefcff6f0069c2c41b8157df" alt=""
3. 获取 TiDB Cloud 集群的 Accound id 和 External id
在 TiDB Cloud 集群的 Overview -》 Import -》 Show AWS IAM policy settings 中获取
data:image/s3,"s3://crabby-images/34564/345649d7aa654c7657cdd2e78d901c0079bab385" alt=""
TiDB Cloud Account id: 380838443567
TiDB Cloud External id: 696e6672612d6170698cf65cc99da4bea3da7cd6717dd5bbbe
在 AWS IAM 中创建 role 时需要用到
4. 在 AWS IAM 中创建 role
(1)选择 “AWS 账户” -》选择 “另一个 AWS 账户” -》 填写 TiDB Cloud Account id -》选择 “需要外部 ID" -》填写 TiDB Cloud External ID
data:image/s3,"s3://crabby-images/0f1c5/0f1c58607fecccb2cbcf3a7c44fd96154f72d41f" alt=""
data:image/s3,"s3://crabby-images/a045d/a045d1857b7cd4a20ea9e8c11d2b4e1bdd9b4790" alt=""
(2)选择之前创建的 Policy,执行下一步
data:image/s3,"s3://crabby-images/990ee/990eeb91057006b80bb40391b745129795f310af" alt=""
(3)role 创建成功
data:image/s3,"s3://crabby-images/35e41/35e41843f6495c4ec6d931e9b91427fdd4689fa9" alt=""
(4)获取 role 的 ARN (arn:aws:iam::255548669385:role/Role_TiDBCloud)
data:image/s3,"s3://crabby-images/e0070/e0070b755218fc3a4698c49d5db35483b454ef6a" alt=""
四、将 AWS S3 数据导入 TiDB Cloud 集群
1. 将 AWS S3 数据 import 至 TiDB Cloud
(1)填写 S3 bucket 实际子目录的 URL
(2)填写 role 的 ARN
(3)选择 Data Format 为 ”TiDB Dumpling“
data:image/s3,"s3://crabby-images/ca136/ca136b233c123252817a92b21f8de52a1596c3e8" alt=""
(4)输入 TiDB Cloud 集群的用户和密码,点击 “Import”
data:image/s3,"s3://crabby-images/13897/138979e1d9cdb6bdf609e270e994ad509398f71c" alt=""
(5)数据导入过程
(6)数据导入成功
data:image/s3,"s3://crabby-images/64d2f/64d2f145780c7f1e3dc30983115915187af3cc47" alt=""
2. 验证数据
(1)方式一:通过本地客户端
data:image/s3,"s3://crabby-images/74d57/74d57afd2d661da97b6f737ce10c84b0af12fd1a" alt=""
(2)方式二:通过 Web SQL Shell
在 TiDB Cloud 集群的 Overview -》 Connect -》 Web SQL Shell 中登录
data:image/s3,"s3://crabby-images/d9c96/d9c968ddbacff0735f233836cdef05afca4a3760" alt=""
原作者:这道题我不会 发布时间:2022/3/27
原文链接:https://tidb.io/blog/c74cf5a1
评论