时序数据库市场漫谈
开源 infra 领域越发火爆,作为开源基础软件领域的从业者,我们也在持续思考基础软件行业的各类机会。我们就时序数据库领域作为开始,来谈谈时序数据库的市场。今后我们也会根据时间安排,分享一些其他细分领域的看法。
本文仅代表个人观点,如有偏颇之处,还请海涵~
🤠🤠🤠
时序数据库市场漫谈
时序数据库趋势如何?
关注数据库领域发展的朋友,相信大家都会知道 DB-Engines,我们首先就来看下 DB-Engines 上的数据库流行度趋势图。从下图,我们可以看到过去 24 个月时序数据库的流行度持续增长,显著优于其他类别的数据库。
过去 24 个月时序数据库流行度趋势图
进入到时序数据库的细分领域,我们可以发现 InfluxDB 一直处于此领域的领先地位。作为一家 2012 年成立,已经融资到 D 轮的企业,其产品已经被很多厂商所使用。但 InfluxDB 也并非高枕无忧,其产品问题存在诸多问题,比如,时间线膨胀导致的严重数据倾斜问题,这是所有时序数据库都面临的问题。第二,在未来的云原生趋势下,对内存的管理要求变得更加严格,InfluxDB 在本地磁盘上使用 mmap 的优势无法继续在未来上云后依然保持高效读写。因此为了面向更广大的应用场景以及处理更海量的数据写入,其也正在开发新的存储引擎 IOx。
DB-Engines 时序数据库排名
InfluxDB 注定不会孤独,成立于 2015 年的海外厂商 TimescaleDB 也在 2021 年完成了 4000 万美元的 B 轮融资。与 InfluxDB 不同,TimescaleDB 走了不同的技术路线,其是基于 PostgreSQL 进行的开发,力争最小化用户的迁移成本,期望借助 PG 生态崛起。但在基础软件的世界,大家总会进行 trade-off,对于 TimescaleDB 来说,高效即时的查询分析任务是 TimescaleDB 的重中之重,所以他舍弃了一部分的压缩性能,也就造成了其磁盘占用会较其他时序数据库相对大一些,与此同时,在高写入场景的情况下,性能也不是非常理想。当然,这些 trade-off 是为了保证 TimescaleDB 更高效即时的查询需求。
国内市场层面,CnosDB、IoTDB 以及 TDengine 三个开源项目希望利用好开源杠杆,针对海外产品的问题,也在抓紧进行弯道超车。
时序数据库是 Niche Market 吗?
我们要理解时序数据库的市场,就要理解影响其市场需求的因子有哪些。从我们的观察来看,这个市场规模大致与三个因素相关:(1)IoT 设备数量。(2)每个设备上所承载的传感器数量的多少。(3)时序数据库的收费。
根据 Statista 的数据(如下图所示),预计到 2025 年全球物联网设备将达 750 亿个,而每个物联网设备是都是要有众多传感器的,我们假设每个设备有 10 个传感器(实际可能不止),这就意味着全球有 7500 亿个传感器。从趋势来说,毫无疑问,全球 IoT 设备在快速增长,传感器数量确实在爆发。
从时序数据库收费角度来看,目前我们观察到的案例是,头部时序数据库厂商平均到每个传感器(sensor)的收费大概 1 元左右(50 万元的付费,大约 50 万个 sensor)。但事实上随着未来规模的扩张,市场竞争加剧,必然会带来价格的下降。但即使每个传感器(sensor)的价格将降为 0.15 元,这也是个千亿级别的市场。
当然这种算法未必科学,我们也很难精确的给出大家一个结论,也仅是想以此给大家一个思考方向,毕竟面对一个增量市场,这个市场中的各方参与者都需要有更多的信心、耐心以及判断力。
时序数据库主要用在哪?
目前来看,时序数据库的应用场景主要是在物联网和系统监控领域,虽然也有一些时序数据库是针对金融场景,但本质上二者不可兼得,金融需要处理一定的事务(他们更像是 kdb+),势必会造成海量数据写入能力的阉割。
从行业集中度来看,可能监控告警在很多行业都有应用,所以时序数据库的垂直行业场景看起来较为零散,无论是与硬件厂商相结合,亦或者与行业解决方案公司合作,其更多的站在了被集成的位置。
今天就聊这么多吧,毕竟仅是个人观点,难免有偏颇之处,还请读者海涵,对于细分市场的判断仁者见仁,智者见智,也欢迎行业内的大家多做沟通和探讨。
CnosDB 简介
CnosDB 是一款高性能、高易用性的开源分布式时序数据库,现已正式发布及全部开源。
版权声明: 本文为 InfoQ 作者【CnosDB】的原创文章。
原文链接:【http://xie.infoq.cn/article/5f0e4937e850b12f7904b2e82】。文章转载请联系作者。
评论