写点什么

【TUG 话题探讨 005】TiDB 生态工具(DM、TiCDC 等)使用场景及常见问题

  • 2022 年 7 月 11 日
  • 本文字数:3626 字

    阅读完需:约 12 分钟

作者: luzizhuo 原文来源:https://tidb.net/blog/65368cf8


10 月 28 日晚上 8 点,第五期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕“TiDB 生态工具(DM,TiCDC 等)使用场景及常见问题” ,以下为讨论节选,其中有一些对 TiDB 的吐槽,我们也邀请了 PingCAP 的产研同学帮忙做了回应。


想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通

监控工具

何傲(神州数码):


有没有考虑在 Dashboard 中集成一下 DM 和 TiCDC 的可视化管理?


王贤净(PingCAP):


暂时还没考虑集成 DM 和 TiCDC,有详细使用需求可以在 Asktug 提交产品需求贴。


田朋(同程旅游):


我感觉 我之前用的数据同步工具挺好用的


田朋(同程旅游):


之前用 dm 判断主从 dm tidb 的延迟不太好判断


田朋(同程旅游):


之前用的是 1.0 在就没用


王贤净(PingCAP):

在改了在改了,可以期待一下 DM 2.1 ~ 延迟监控增加了一些更细节的监控项,预计十一月中下旬发版,感兴趣可以关注 release node


江坤(神州数码):


Dashboard 里面能增加一个参数视图嘛,最好能有默认参数和集群设置参数的对比?


王贤净(PingCAP):

默认参数和集群参数设置对比,这个有在考虑,TiUP 有一个小工具 clinic checker 已经在做了。Clinic 诊断工具套件是 Autopilot 组提供的一组 TiDB 集群诊断工具,包括数据采集以及问题诊断,感兴趣的话可以联系我们内部人员优先试用。

迁移工具

代晓磊(360):


我来抛个砖:应用场景 1:TiDB 集群多机房互备 (经常听人讲 2 地 3 中心);2:数仓团队凌晨 ETL ;3:MySQL 迁移 tidb 后,替换之前的 canal/maxwell 等同步工具。


王天宜:


cdc 工具考虑直接将数据同步到 hdfs 的方案吗?


代晓磊(360):


考虑的,做增量备份可以用到


王天宜:


目前 canal 是有对接 hdfs 的接口,cdc 现在还没有吧。TiDB 拥有优秀的 TP 能力,目前 TiFlash 还没有 PB 级别的存储能力,是否可以考虑 cdc 工具落盘到 hdfs。


赵一霖(PingCAP):


目前短期内不会考虑 cdc 工具落盘到 hdfs,有详细使用需求可以在 Asktug 提交产品需求贴。

DM(Data Migration)

代晓磊(360):


DM 对 MySQL 分库分表的主键冲突解决不太友好,1000 张表需要配置 1000 个匹配规则。另外就是 DM 同步的上下游不太好做数据校验。


田朋(同程旅游):


MySQL 的主键 + 分片键 =tidb,联合唯一索引


王贤净(PingCAP):

我记得早期 需要用 column mapping 比较复杂, DM 1.0 后续版本以及 2.0 的话主键冲突问题解决选择性会多一些,比如 联合唯一索引,或者 2.0 下游新增一个主键列 auto_random 都可行~


代晓磊(360):


DM1.0 跟 2.0 的变化还是挺大,之前就有人反馈过,从 1.0 升级到 2.0 出现问题又回滚的。


王贤净(PingCAP):

确实,因为内部结构变化比较大, 所以运维起来和 1.0 差距有点多,大家可以看下 PE 的 TiDB 数据同步与复制相关课程了解下。


田朋(同程旅游):


如果 是 mycat 或者 shard 的分库 分表 中间件 咋校对数据,就是 TiDB 和 MySQL 的表结构不一样了 这时候校对数据挺麻烦的


王贤净(PingCAP):

这个 sync diff 也在重做呢,预计会添加实时校验功能,不仅是 DM 同步的数据,TiCDC/drainer 这些都可以~


闫颖颖(瑞幸):


TiDB 那个一致性校验工具也可以用于 MySQL 吧?


王贤净(PingCAP):

Sync-diff 当前版本可以校验 MySQL/TiDB 中两份数据是否一致

又回到监控

代晓磊(360):


Tidb 推进自有 TiDB cloud 后希望能在 tidb operator 上还要继续更新迭代,因为不少公司使用私有云,对该“工具”还是比较依赖的。


田朋(同程旅游):


全量 可以增加一些监控 比如 总量多少 同步多少 还有多少没同步完。增量 能展示出 完成多少 gtid 上游 gtid 的位置 手动调整 gtid 啥的


王贤净(PingCAP):

这个的话,目前是有一个监控,load unit 导入过程的进度百分比的,不过需求收到,看看能不能更细粒度的展示~


陈加持(哗啦啦):


增量可以计算差距多少 binlog 文件数。


田朋(同程旅游):


用 dm 比较少 我还是感觉 我们 dbrep 好用


代晓磊(360):


Tidb dashboard 希望能像之前东旭那篇可观测性的文章那样,把一些能够定位问题的核心指标加入其中 (用好的话,可以费了 grafana),以后 grafana 就只是排查更细节的问题时使用了。其实 dashboard 中像热点可视化等这种功能点多一些就好了。


王贤净(PingCAP):

需求已接收,感谢晓磊老师建议,目前也在逐步完善 dashboard 的相关指标中。

备份工具

陈臣:


之前用 mydumper 备份 tidb 的时候,会有个 select min (id),max(id) from t 的操作,走的是全表扫描,即使 id 是自增主键,不知道这个修了嘛?


房晓乐(PingCAP):


这个早修复了,但不知道版本


王贤净(PingCAP):


dumpling 不香嘛!强烈推荐 dumpling ~


田朋(同程旅游):


dumping 真的香,我用 dumping 搞过超大的库,单表备份出来 都 1t 2t 多,大概有 99 个表吧,用 Tidb Lightning 恢复的 有时候还会异常 在重新拉起就行。


王贤净(PingCAP):


tidb-lightning 配置不同后端 工作原理不太一样,不过都支持断点续传,重新拉起来就可以


王贤净(PingCAP):


各位老师觉得 lightning local 模式导入快么 ?未来会把 lightning 集合在 DM 里,全量阶段导入就快很多了


田朋(同程旅游):


嗯 MySQL 和 tidb 表结构不一定一致,而且 多个 MySQL 导进去 可以嘛 local 不是 不能有数据嘛


王贤净(PingCAP):


lightning local 模式支持并行导入啦,从并行角度理解可以是非空表,但是注意还不能增量导入


田朋(同程旅游):


表结构不一致也可以嘛


王贤净(PingCAP):


哪种场景呢?下游多列是可以的,传送一波官方文档 https://docs.pingcap.com/zh/tidb/dev/tidb-lightning-distributed-import#tidb-lightning- 分布式并行导入


田朋(同程旅游):


MySQl 的备份 用 light 恢复 恢复到 tidb 用 local 模式,但 tidb 列比 MySQL 多


王贤净(PingCAP):


亲测可行,之前也有用户这样用过,下游 tidb 列比上游 mysql 多


王贤净(PingCAP):


还有各位老师 觉得 DM 同步延迟慢的问题,也在优化啦~~ 感兴趣的记得参加 360 企业行


王贤净(PingCAP):


话说大家觉得 生态工具类 troubleshooting 的文档 各位老师需要嘛 ,好像目前比较少


陈臣:


这个需要,确实有点少

往期技术探讨回顾


【TUG 话题探讨 001】TiDB 的应用场景有哪些?看看 TUG 的技术专家怎么说 TUG 技术探讨


技术话题探讨 8 月 19 日,TUG 群里进行了第一次技术话题探讨会活动,本次探讨会主题为“TiDB 应用场景”,TUG 社群中多位技术专家参与了讨论,以下为讨论分享(为方便大家阅读,顺序有调整): 首先,来自 58 同城的刘春雷分享了 58 对 TiDB 的应用场景 58 同城 - 刘春雷: MySQL 大表: 对于不涉及交易业务的大单表:超过 100G 的,条数大于 1 亿的,全部迁移到…



【TUG 话题探讨 002】看看 TUG 的技术专家都在用哪些数据库? TUG 技术探讨


9 月 2 日晚上 8 点,第二期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕大家都在用哪些数据库,核心数据库是哪个,以下为讨论分享(为方便大家阅读,顺序有调整): ps: 由于部分信息不适合外放,以下是节选信息,你也可以申请加入 TUG 群参与每期技术话题沟通 大家都在用哪些数据库? 肖飞 - 嘉里大通物流: sql, oracle , apache ignite , tidb。…



【TUG 话题探讨 003】TUG 专家们如何做 TiDB 性能调优 TUG 技术探讨


9 月 16 日晚上 8 点,第三期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕系统经过什么方式调优之后,性能能有较多提升 ,以下为讨论节选。 想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通 调优之硬件配置 万强 - 云腾未来 - 数据库运维工程师: 硬件设备足够好 李欧 上海文广 dba: 加内存,升级新的 ssd 肖飞 - 嘉里大通物流 - 架构师: 先…



【TUG 话题探讨 004】对 TiDB 的爱恨之情! TUG 技术探讨


10 月 14 日晚上 8 点,第四期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕“对 TiDB 的爱恨之情” ,以下为讨论节选,其中有一些对 TiDB 的吐槽,我们也邀请了 PingCAP 的产研同学帮忙做了回应。 想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通 讨论节选 春雷(58 同城): 对 TiDB 最爱的是:官方服务完美;最恨的是手…

话题征集,参与奖励 100 分,采纳奖励 300 分


【TUG 群】技术话题征集,参与奖励 100 分,采用奖励 300 分 关于 TUG


TUG 介绍 TUG 是什么? TUG 是汇聚全球数据库、大数据技术从业者的社区,是一个独立、自发、不以盈利为目的的组织。 TUG 做什么? 探索最前沿的数据库、大数据技术; 沉淀优质内容进行赋能; 搭建人才平台,共建社区; 加入 TUG ,你能获得什么? 让数据库、大数据从业者找到自己的圈子; 发表技术见解,收获前沿知识,提升个人影响力。 探索技术问题,随时随地交流成长,解决问题; 有奖…

加入 TUG

如果你也对数据库、大数据感兴趣,想与业界大咖们一起交流最前沿的数据库与大数据知识,欢迎加入 TUG,和 TUG 一起成长!


扫码报名或者点击链接跳转报名



.png”)


发布于: 刚刚阅读数: 2
用户头像

TiDB 社区官网:https://tidb.net/ 2021.12.15 加入

TiDB 社区干货传送门是由 TiDB 社区中布道师组委会自发组织的 TiDB 社区优质内容对外宣布的栏目,旨在加深 TiDBer 之间的交流和学习。一起构建有爱、互助、共创共建的 TiDB 社区 https://tidb.net/

评论

发布
暂无评论
【TUG 话题探讨 005】TiDB 生态工具(DM、TiCDC等)使用场景及常见问题_TiDB 社区干货传送门_InfoQ写作社区