墨天轮国产数据库沙龙 | 张玮绚:TDengine,高性能、分布式、支持 SQL 的时序数据库
分享嘉宾:张玮绚(Wade Zhang)北京涛思数据科技有限公司(TDengine)研发 VP 整理:墨天轮
导读
TDengine 是一款高性能、分布式、支持 SQL 的时序数据库,让大量设备、数据采集器每天产生的高达 TB 甚至 PB 级的数据能得到高效实时的处理,对业务的运行状态进行实时的监测、预警,从大数据中挖掘出商业价值。
我今天的分享的内容分为四个主题:TDengine 诞生的行业背景、TDengine 的产品特性、开源和商业策略以及 TDengine 的几个典型应用案例。
TDengine 诞生的行业背景
1、时序数据与时序数据库
TDengine 是高性能、分布式、支持 SQL 的时序数据库,对时序数据库进行一句话的定义,那就是:对时序数据进行存储、查询和计算服务的数据库。这就衍生出一个新的问题,什么是时序数据?
时序数据是按时间顺序产生的结构化数据,同一数据源所产生的时序数据是完全同构的,同一类数据源所产生的时序数据也往往是同构的或高度相似的,TDengine 创始人陶建辉总结了时序数据的十大特征。
图 1 时序数据的十大特征
2、TDengine 诞生的行业背景
时序数据在各行各业都有着广泛的应用,如电信电网、银行金融、交通物流、IT 运维、传统制造业等,这些数据对业务具有非常重要的价值。
如何存储时序数据呢?有不少厂商用传统的数据库进行尝试,但这些解决方案都有着各自先天的局限性。以关系型数据库为例,它在海量时序数据读写上性能低,同时数据量越大查询越慢。在这样的背景下,时序数据库 TDengine 便应运而生了。
图 2 时序数据存储方案的各种选择
TDengine 的产品特性
1、TDengine 的产品特性
高性能:插入和查询性能都优于 InfluxDB
分布式:集群方案开源
支持 SQL:语法尽量与标准 SQL 兼容
2、TDengine 的优势
TDengine 有八大优势:高性能写入、高性能查询、开源的分布式集群解决方案、支持 SQL 易用性高、安装部署快速简单、省空间、易集成、易运维。
首先,TDengine 的优势体现在高性能写入与高性能查询。通过充分利用时序大数据的特点,TDengine 团队设计了充分利用时序数据特性的存储引擎,将数据的写入和查询速度大幅提升,同时数据压缩率也大幅提高。
与流行的时序数据库 InfluxDB 相比,TDengine 完全采用 InfluxDB 自身提供的测试框架、数据集和测试场景,写入速度至少是其 2 倍以上,在设备数量超过 1000 以后,写入速度则是其 5.2 倍;对于查询场景,极个别的与 InfluxDB 速度持平,绝大部分都是几倍的速度,有的情况下甚至高达 40 倍。
图 3 TDengine 与 InfluxDB 在写入上的对比
图 4 TDengine 与 InfluxDB 在查询上的对比
TDengine 的优点还体现在它是一个开源的分布式集群解决方案。不同于 InfluxDB(集群方案不开源) 与 Prometheus(不支持集群),TDengine 能够很好地水平扩展,轻松支持海量级的时间线和数据量。
图 5 TDengine 的集群架构
支持 SQL,易用性高 是 TDengine 的第四个优点。
SQL 是世界上最简单易用、最流行的查询语言,为众多程序员所喜爱,这样能够降低学习门槛和应用程序迁移成本。TDengine 还支持 Java、Go、Python、Rust、nodeJS 和 C# 等语言环境。同时,用户也能够通过 RESTful 接口来插入与查询数据。
不仅如此,TDengine 的优势还体现在安装部署快速简单、省空间、易集成、易运维。
TDengine 的开源和商业模式
1、TDengine 核心代码与集群方案完全开源
图 6 TDengine 社区版开源统计数据
2、TDengine 的商业模式
TDengine 有三种的商业模式,分别是开源社区版、企业版、云服务版。
开源社区版:核心代码完全一样,建立开发者社区,打造生态。
企业版:支持独立部署,年度订阅模式销售,根据数据量计费。
辅助功能:安全(异地容灾、加密、审计等),运维工具等
技术服务:专业团队提供强有力的技术支持
云服务版:在阿里云、AWS 等云平台上直接提供 PaaS 服务,根据数据量和时长计费。
TDengine 的客户案例
TDengine 用户主要来自物联网、工业互联网、车联网、物流、IT 运维监测、电力、智慧城市、智慧矿山等领域,接下来分享我们两个典型的客户案例。
1、客户案例一:顺丰科技
顺丰科技原先采用 OpenTSDB+HBase 作为大数据监控平台全量监控数据的存储方案,整个平台平均写入数十亿条/天。但随着大数据监控平台接入的数据量越来越大,有很多痛点需要解决,包括依赖多、使用成本高和性能不能满足等问题。
在进行数据库选型时,TDengine 能够满足性能、成本、运维难度的需求,支持横向扩展并具有且高可用的优势。完成改造后,TDengine 集群轻松扛住了全量监控数据写入,运行稳定。
图 7 顺丰在采用 TDengine 后的改造效果
2、客户案例二:理想汽车
随着业务数据量级的上升,理想汽车的物联网场景业务对数据存储性能的要求不断提高。在信号上报业务中,需要将标记时间戳和采集点的信息,通过云端写入到后端数据库中,有一定的聚合查询需求。
在这些需求下,通过深入业务封闭式测试,TDengine 表现出了极其优秀的高并发写入和数据压缩能力,极大降低了业务成本和业务压力。
图 8 理想汽车在采用 TDengine 后的成本对比
目前,TDengine 被广泛运用于物联网、工业互联网、车联网、IT 运维、能源、金融等领域,安装实例数已经超过 10 万,而且遍布全球,点击查看更多 TDengine 客户案例。
图 9 TDengine 的客户行业与领域
我今天的分享就到这里,谢谢大家!
更多精彩内容,欢迎大家观看现场视频回放与会议资料视频回放:https://www.modb.pro/video/6116会议资料:https://www.modb.pro/doc/56840
查看【国产数据库沙龙】往期生态工具、图数据库专场资源:https://www.modb.pro/topic/157860
墨天轮,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、活动直播、在线课程、文档阅览、资源下载、知识分享及在线运维为一体的统一平台,持续促进数据领域的知识传播和技术创新。
关注官方公众号: 墨天轮、 墨天轮平台、墨天轮成长营、数据库国产化 、数据库资讯
版权声明: 本文为 InfoQ 作者【墨天轮】的原创文章。
原文链接:【http://xie.infoq.cn/article/d3a8f3944de385736a9f8e2ca】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论