【TUG 话题探讨 005】TiDB 生态工具(DM、TiCDC 等)使用场景及常见问题
作者: luzizhuo 原文来源:https://tidb.net/blog/65368cf8
10 月 28 日晚上 8 点,第五期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕“TiDB 生态工具(DM,TiCDC 等)使用场景及常见问题” ,以下为讨论节选,其中有一些对 TiDB 的吐槽,我们也邀请了 PingCAP 的产研同学帮忙做了回应。
想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通
监控工具
何傲(神州数码):
有没有考虑在 Dashboard 中集成一下 DM 和 TiCDC 的可视化管理?
王贤净(PingCAP):
暂时还没考虑集成 DM 和 TiCDC,有详细使用需求可以在 Asktug 提交产品需求贴。
田朋(同程旅游):
我感觉 我之前用的数据同步工具挺好用的
田朋(同程旅游):
之前用 dm 判断主从 dm tidb 的延迟不太好判断
田朋(同程旅游):
之前用的是 1.0 在就没用
王贤净(PingCAP):
在改了在改了,可以期待一下 DM 2.1 ~ 延迟监控增加了一些更细节的监控项,预计十一月中下旬发版,感兴趣可以关注 release node
江坤(神州数码):
Dashboard 里面能增加一个参数视图嘛,最好能有默认参数和集群设置参数的对比?
王贤净(PingCAP):
默认参数和集群参数设置对比,这个有在考虑,TiUP 有一个小工具 clinic checker 已经在做了。Clinic 诊断工具套件是 Autopilot 组提供的一组 TiDB 集群诊断工具,包括数据采集以及问题诊断,感兴趣的话可以联系我们内部人员优先试用。
迁移工具
代晓磊(360):
我来抛个砖:应用场景 1:TiDB 集群多机房互备 (经常听人讲 2 地 3 中心);2:数仓团队凌晨 ETL ;3:MySQL 迁移 tidb 后,替换之前的 canal/maxwell 等同步工具。
王天宜:
cdc 工具考虑直接将数据同步到 hdfs 的方案吗?
代晓磊(360):
考虑的,做增量备份可以用到
王天宜:
目前 canal 是有对接 hdfs 的接口,cdc 现在还没有吧。TiDB 拥有优秀的 TP 能力,目前 TiFlash 还没有 PB 级别的存储能力,是否可以考虑 cdc 工具落盘到 hdfs。
赵一霖(PingCAP):
目前短期内不会考虑 cdc 工具落盘到 hdfs,有详细使用需求可以在 Asktug 提交产品需求贴。
DM(Data Migration)
代晓磊(360):
DM 对 MySQL 分库分表的主键冲突解决不太友好,1000 张表需要配置 1000 个匹配规则。另外就是 DM 同步的上下游不太好做数据校验。
田朋(同程旅游):
MySQL 的主键 + 分片键 =tidb,联合唯一索引
王贤净(PingCAP):
我记得早期 需要用 column mapping 比较复杂, DM 1.0 后续版本以及 2.0 的话主键冲突问题解决选择性会多一些,比如 联合唯一索引,或者 2.0 下游新增一个主键列 auto_random 都可行~
代晓磊(360):
DM1.0 跟 2.0 的变化还是挺大,之前就有人反馈过,从 1.0 升级到 2.0 出现问题又回滚的。
王贤净(PingCAP):
确实,因为内部结构变化比较大, 所以运维起来和 1.0 差距有点多,大家可以看下 PE 的 TiDB 数据同步与复制相关课程了解下。
田朋(同程旅游):
如果 是 mycat 或者 shard 的分库 分表 中间件 咋校对数据,就是 TiDB 和 MySQL 的表结构不一样了 这时候校对数据挺麻烦的
王贤净(PingCAP):
这个 sync diff 也在重做呢,预计会添加实时校验功能,不仅是 DM 同步的数据,TiCDC/drainer 这些都可以~
闫颖颖(瑞幸):
TiDB 那个一致性校验工具也可以用于 MySQL 吧?
王贤净(PingCAP):
Sync-diff 当前版本可以校验 MySQL/TiDB 中两份数据是否一致
又回到监控
代晓磊(360):
Tidb 推进自有 TiDB cloud 后希望能在 tidb operator 上还要继续更新迭代,因为不少公司使用私有云,对该“工具”还是比较依赖的。
田朋(同程旅游):
全量 可以增加一些监控 比如 总量多少 同步多少 还有多少没同步完。增量 能展示出 完成多少 gtid 上游 gtid 的位置 手动调整 gtid 啥的
王贤净(PingCAP):
这个的话,目前是有一个监控,load unit 导入过程的进度百分比的,不过需求收到,看看能不能更细粒度的展示~
陈加持(哗啦啦):
增量可以计算差距多少 binlog 文件数。
田朋(同程旅游):
用 dm 比较少 我还是感觉 我们 dbrep 好用
代晓磊(360):
Tidb dashboard 希望能像之前东旭那篇可观测性的文章那样,把一些能够定位问题的核心指标加入其中 (用好的话,可以费了 grafana),以后 grafana 就只是排查更细节的问题时使用了。其实 dashboard 中像热点可视化等这种功能点多一些就好了。
王贤净(PingCAP):
需求已接收,感谢晓磊老师建议,目前也在逐步完善 dashboard 的相关指标中。
备份工具
陈臣:
之前用 mydumper 备份 tidb 的时候,会有个 select min (id),max(id) from t 的操作,走的是全表扫描,即使 id 是自增主键,不知道这个修了嘛?
房晓乐(PingCAP):
这个早修复了,但不知道版本
王贤净(PingCAP):
dumpling 不香嘛!强烈推荐 dumpling ~
田朋(同程旅游):
dumping 真的香,我用 dumping 搞过超大的库,单表备份出来 都 1t 2t 多,大概有 99 个表吧,用 Tidb Lightning 恢复的 有时候还会异常 在重新拉起就行。
王贤净(PingCAP):
tidb-lightning 配置不同后端 工作原理不太一样,不过都支持断点续传,重新拉起来就可以
王贤净(PingCAP):
各位老师觉得 lightning local 模式导入快么 ?未来会把 lightning 集合在 DM 里,全量阶段导入就快很多了
田朋(同程旅游):
嗯 MySQL 和 tidb 表结构不一定一致,而且 多个 MySQL 导进去 可以嘛 local 不是 不能有数据嘛
王贤净(PingCAP):
lightning local 模式支持并行导入啦,从并行角度理解可以是非空表,但是注意还不能增量导入
田朋(同程旅游):
表结构不一致也可以嘛
王贤净(PingCAP):
哪种场景呢?下游多列是可以的,传送一波官方文档 https://docs.pingcap.com/zh/tidb/dev/tidb-lightning-distributed-import#tidb-lightning- 分布式并行导入
田朋(同程旅游):
MySQl 的备份 用 light 恢复 恢复到 tidb 用 local 模式,但 tidb 列比 MySQL 多
王贤净(PingCAP):
亲测可行,之前也有用户这样用过,下游 tidb 列比上游 mysql 多
王贤净(PingCAP):
还有各位老师 觉得 DM 同步延迟慢的问题,也在优化啦~~ 感兴趣的记得参加 360 企业行
王贤净(PingCAP):
话说大家觉得 生态工具类 troubleshooting 的文档 各位老师需要嘛 ,好像目前比较少
陈臣:
这个需要,确实有点少
往期技术探讨回顾
【TUG 话题探讨 001】TiDB 的应用场景有哪些?看看 TUG 的技术专家怎么说 TUG 技术探讨
技术话题探讨 8 月 19 日,TUG 群里进行了第一次技术话题探讨会活动,本次探讨会主题为“TiDB 应用场景”,TUG 社群中多位技术专家参与了讨论,以下为讨论分享(为方便大家阅读,顺序有调整): 首先,来自 58 同城的刘春雷分享了 58 对 TiDB 的应用场景 58 同城 - 刘春雷: MySQL 大表: 对于不涉及交易业务的大单表:超过 100G 的,条数大于 1 亿的,全部迁移到…
【TUG 话题探讨 002】看看 TUG 的技术专家都在用哪些数据库? TUG 技术探讨
9 月 2 日晚上 8 点,第二期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕大家都在用哪些数据库,核心数据库是哪个,以下为讨论分享(为方便大家阅读,顺序有调整): ps: 由于部分信息不适合外放,以下是节选信息,你也可以申请加入 TUG 群参与每期技术话题沟通 大家都在用哪些数据库? 肖飞 - 嘉里大通物流: sql, oracle , apache ignite , tidb。…
【TUG 话题探讨 003】TUG 专家们如何做 TiDB 性能调优 TUG 技术探讨
9 月 16 日晚上 8 点,第三期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕系统经过什么方式调优之后,性能能有较多提升 ,以下为讨论节选。 想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通 调优之硬件配置 万强 - 云腾未来 - 数据库运维工程师: 硬件设备足够好 李欧 上海文广 dba: 加内存,升级新的 ssd 肖飞 - 嘉里大通物流 - 架构师: 先…
【TUG 话题探讨 004】对 TiDB 的爱恨之情! TUG 技术探讨
10 月 14 日晚上 8 点,第四期技术话题探讨会在 TUG 群里如期而至,本次探讨会主要围绕“对 TiDB 的爱恨之情” ,以下为讨论节选,其中有一些对 TiDB 的吐槽,我们也邀请了 PingCAP 的产研同学帮忙做了回应。 想和 TUG 专家深入沟通,你也可以申请加入 TUG 群参与每期技术话题沟通 讨论节选 春雷(58 同城): 对 TiDB 最爱的是:官方服务完美;最恨的是手…
话题征集,参与奖励 100 分,采纳奖励 300 分
【TUG 群】技术话题征集,参与奖励 100 分,采用奖励 300 分 关于 TUG
TUG 介绍 TUG 是什么? TUG 是汇聚全球数据库、大数据技术从业者的社区,是一个独立、自发、不以盈利为目的的组织。 TUG 做什么? 探索最前沿的数据库、大数据技术; 沉淀优质内容进行赋能; 搭建人才平台,共建社区; 加入 TUG ,你能获得什么? 让数据库、大数据从业者找到自己的圈子; 发表技术见解,收获前沿知识,提升个人影响力。 探索技术问题,随时随地交流成长,解决问题; 有奖…
加入 TUG
如果你也对数据库、大数据感兴趣,想与业界大咖们一起交流最前沿的数据库与大数据知识,欢迎加入 TUG,和 TUG 一起成长!
扫码报名或者点击链接跳转报名
.png”)
版权声明: 本文为 InfoQ 作者【TiDB 社区干货传送门】的原创文章。
原文链接:【http://xie.infoq.cn/article/d24ea3414e01e87d2291802f1】。文章转载请联系作者。
评论