一个 39.3T 的集群从 TiDB v3.1.0 迁移升级到 TiDB v7.1.2 的实践
作者: xingzhenxiang 原文来源:https://tidb.net/blog/0629c299
集群目前情况
数据 39.3T
tidb 版本
数据导出方式选择
1、BR 这个版本刚开始支持,不知道有什么未知 bug,暂时没有选择
2、逻辑导出,首先考虑同版本发行对应的 mydumper,出现 tidb server 内存耗尽,放弃
3、最后选择 dumpling v7.1.2,看文档说事兼容以前版本
导出命令
复制代码
注意密码需要显示配置,否则会报如下错
复制代码
导入测试
1、逻辑导入
导入配置文件
复制代码
遇到问题
报错内容,考虑导入并发参数过大,所以修改并发参数为 cpu 的 75%(region-concurrency = 42,第三次调整为 32, 第四次调整为 24,第五次调整为 14 就不报错了)
复制代码
2、物理导入
物理导入配置文件(只有一个 lightning 导入)
复制代码
遇到问题
正常现象相关解释(https://asktug.com/t/topic/1018802/1)
复制代码
导入测试结果对比
逻辑导入(导入时长 14 天)
物理导入(导入时长 4 天)
数据记录 count(*) 两种方式是一样的
物理导入压缩比更高,导入时长更短,为啥不直接使用物理导入,因为官网限制说明有歧义,一个说单表一个说单实例,只能自己测试验证一下,还有一个原因就是我这是单库数据量为 17.30T(sql 文件)
正式导入
配置 mysql 二进制日志周期为 30 天,采用 lighting 物理导入方式导入,导入完后同步增量数据到最新。
版本信息
验证数据
select count(*)from table_xxx where create_date_time<‘2012-12-25’
所有重要表验证完毕,任务完成
版权声明: 本文为 InfoQ 作者【TiDB 社区干货传送门】的原创文章。
原文链接:【http://xie.infoq.cn/article/cf53746c1dd20cddae7d82be3】。文章转载请联系作者。
评论