大数据场景实践
0 人感兴趣 · 10 次引用
- 最新
- 推荐
基于 TiDB+Flink 实现的滑动窗口实时累计指标算法
前言在不少的支付分析场景里,大部分累计值指标可以通过 T+n 的方式计算得到 。随着行业大环境由增量市场转为存量市场,产品的运营要求更加精细化、更快速反应,这对各项数据指标的实时性要求已经越来越...
百 TB 级 TiDB 集群在线更换 NVME 磁盘优化实践
前言在全球经济不景气,中国经济发展放缓的大背景下,各行各业都在通过不同方式进行降本增效。我们就是在这样的大目标下,对公司的 TiDB 集群进行了不同的优化实践。前期我们根据业务特点,不断优化SQ...
将业务从 mysql 迁移至 TIDB,有哪些需要注意的?
背景双十一刚过,至此,两个月前我们从mysql迁移到TIDB的一套业务算是正式成功了。集团有一套业务库,对接淘宝流量,据说每年双十一的时候流量过大会导致各种问题,苦不堪言。经过内部评估,我们决定...
依据 TIdb 执行计划的 sql 调优案例分享
序言上周支持了一个金融场景的tidb项目,集群版本是5.1.2,因为某些原因,未使用tiflash组件,而在生产中又确实有许多复杂的sql需要执行,且存在部分高并发的sql,基于现状,就做了很多...
上游 sql 通过 drainer 同步到 kafka 时在 kafka 中是什么样子的
环境:上游为v5.4.1版本tidb集群,下游为2.12-2.4.1版本kafka集群,使用drainer进行同步数据本文对上游中的ddl、dml在下游是如何体现,以及是否会对同步产生影响,做个...
TiCDC 同步延迟问题处理
今天分享一个前几周遇到的一个 TiCDC 同步 MySQL 数据延迟的问题,处理过程一波三折,希望对大家有所帮助;(笔者能力有限,文章中如果存在技术性或描述性等错误,请大家及时指正,非常感谢!)...
TiSpark 3.0.0 新特性实践
背景TiSpark 3.0.0 于 6 月 15 号发布了,新的版本中提到了很多期望已久的功能,本文对几个新特性做了对比测试,验证新版本的特性是否符合线上要求。本文基础运行环境为 Spark O...
TiCDC 系列分享 -02- 剖析同步模型与基本架构
一、同步模型1.1 流式处理与批量处理 “数据同步” 本质上讲属于 “数据处理”,即:从数据的一端流向另一端的数据处理,“端” 以产品为单位,包含分布式集群。那么 “数据处理” 类...
TiCDC 系列分享 -01- 简述产生背景及使用概况
一、项目背景 如 PingCAP 官网 所述,TiCDC 的使用场景主要有 “数据库灾备” 及 “数据集成”。熟悉 TiDB 周边生态的爱好者一定知道 “TiDB Binlog” ...
TiDB 冷热存储分离解决方案
结论先行TiDB 6.0 的 Placement Rules in SQL 功能正式 GA,用户通过 SQL 配置数据在 TiKV 集群中的放置位置,可以对数据进行直接的管理,满足不同的业务场景...