写点什么

TiDB HTAP 特性的应用场景简析

  • 2022 年 7 月 11 日
  • 本文字数:1764 字

    阅读完需:约 6 分钟

作者: yifan 原文来源:https://tidb.net/blog/da6fe78a


TiDB 是一种典型的 HTAP 数据库,即交易分析混合负载型 DB,目前已经成为一种流行的新型数据库代表,具有隔离性、实时性、一致性“三性合一”的优秀特性,同时随着版本的迭代,AP 的能力在逐渐增强。HTAP 不仅概念很火,并且也在逐渐成为除 OLTP、OLAP 之外,越来越多数据库用户新的选型规范。然而,现阶段,又存在一些现象:一是一夜之间,所有的数据库都变成了 HTAP 数据库;二是除了“能同时承载交易与分析 SQL”这一极易模糊的理解之外,基本没有清晰明确的界定;自然而然,对 HTAP 的应用场景,也是八仙过海,各式各样,并不清晰的。这些,都导致 HTAP 有成为一种噱头的趋势。


1. HTAP 的界定


这里认为,HTAP 既然要成为一种新的标准与规范,就必须有尽量明确界定。而达此目的的最基本原则,就是它在技术上必须有不同于过去经典数据库的能力(不应该只是分布式),并且必须对客户的数字化进程带来创新与升级,这同时包括业务架构、应用架构、数据架构与技术架构等层面。面向这一原则,其定义与界定可以持续探讨,而本文仅提出如下几点以供参考:


(1)HTAP 在技术架构与设计目标上不应该等同于经典 Oracle 与 MySQL,或分布式后的类 Oracle 与 MySQL,因为如果经典 Oracle 与 MySQL 也算是 HTAP 的话(用“能同时承载交易与分析 SQL”来衡量,那肯定是),HTAP 的定义,就毫无意义;


(2)HTAP 数据库的交易与分析任务的执行,应该能做到用户透明使用且有互不影响的基础,而不应该是 AP 多了大幅影响 TP,TP 多了大幅影响 AP,经典 Oracle 与 MySQL 正是如此;


(3)HTAP 不应该面向数仓类纯 OLAP 的需求。也就是说,其对企业数据架构的提升,现阶段不应该以摒弃数据仓库体系为目标;


(4)现在的 HTAP 数据库,应该是分布式数据库。


如果用以上标准来界定的话,就可以很明确的判定:除 TiDB 之外,很多其它号称 HTAP 的数据库,其实并不是真正的 HTAP。


2. TiDB HTAP 应用场景


前面说过,TiDB 这种真正的 HTAP 特性给客户带来的,应该是业务与架构的创新与提升,而不仅仅是替换或者性能的提高。由此出发,本文认为 TiDB HTAP 的应用场景主要集中如下两个方面:


(1)分析能力内嵌的业务系统(Analytic-Embeded OLTP)


有了 HTAP 的能力,未来的交易型业务系统,都应该在业务交易侧,就天生拥有分析的能力,并且不影响交易的性能与数据的一致性。如风控、营销或者其它原来需要在后台数据平台端通过数据迁移与同步才能完成的能力,相当一部分,可以迁移到业务系统侧实时完成,成为业务系统内在的功能,使其本身就能完成一定程度的业务闭环,这必然是技术驱动现代业务发展的重要方向。


未来的业务系统应该以此标准来设计,这对现代交易系统的业务能力改造与升级有很大的意义。


(2) 以“用”为核的数据服务超市(Data SuperStore)


大多数的数据仓库(Data Warehouse)体系,都是为“管”而生的,应用很难享受到数据的红利。绝大多数的企业,在花大量精力建立了数据仓库(Data Warehouse)体系后,业务系统与人员大多只能通过“请求技术人员协助完成”及“把数据导到业务系统来”两种方式来使用数据,这种应用与数据分隔的现象是大多数企业过去很长一段时间及至今都极为关注的痛点。


面向数据消费,在现有数据平台之上,建立以“用”为核,以“管”为基的数据服务平台,即数据中台这一概念的正确解释,已经成为很多企业规划与实施的重点创新与升级应用之一。它不同于 Data WareHouse 是为了存与管,而是为了让全企业的用户能将数据(准确讲是面向业务整理后的数据资产,因不是本文重点,这里不作赘述)当作超市的商品一样自由选择与消费,从而让全企业享受到数据的红利,因此,这里认为称之为数据服务超市(Data SuperStore)更为恰当。然而,抛开数据资产体系建立等架构与模型层面的内容不说,应该用什么样的数据库来承载这个 SuperStore 呢?


面向数据消费的 SuperStore,即要承载来自全企业的大量、高并发的服务型查询需求(QPS 的 TP 型),也要承载大量探索型的统计分析需求(AP 型),这种要求显然不是纯 OLAP 数据库,也不是纯 OLTP 数据库能满足的,显然又必须是弹性分布式的。因此,过去相当多的数据服务平台,都是采用多种类型数据库,组合满足不同需求来设计的。那么,以 TiDB 为典型代表的 HTAP 数据库,就应该是该场景的最佳选择。


发布于: 刚刚阅读数: 2
用户头像

TiDB 社区官网:https://tidb.net/ 2021.12.15 加入

TiDB 社区干货传送门是由 TiDB 社区中布道师组委会自发组织的 TiDB 社区优质内容对外宣布的栏目,旨在加深 TiDBer 之间的交流和学习。一起构建有爱、互助、共创共建的 TiDB 社区 https://tidb.net/

评论

发布
暂无评论
TiDB HTAP特性的应用场景简析_数据库架构设计_TiDB 社区干货传送门_InfoQ写作社区