写点什么

墨天轮访谈 | Pika 数据库陈磊:云时代下,键值数据库是否会被替代?

作者:墨天轮
  • 2022 年 3 月 22 日
  • 本文字数:1971 字

    阅读完需:约 6 分钟

分享嘉宾陈磊 开源数据库 Pika 项目 PMC 核心人员 

整理墨天轮社区

导读

大家好,今天我分享的主题是:KV 数据库,云时代的文件存储。 随着 AI 和机器学习等技术的发展,数据演变为了十分宝贵的资源,数据存储也是非常活跃的领域。现在踊跃出很多数据库,以及数据存储的高质量开源项目。

那么像键值数据库这样较为老牌的存储的类型 在云时代下是否还有价值,KV 数据库是否会被其他的数据库替代呢?借着今天分享的机会,我想与大家讨论这个问题,同时也谈谈我对以上的思考。

注:KV 数据库 即 键-值数据库(Key–value database)

有关 Pika

1、Pika 简介

Pika 属于分布式 NoSQL 数据库,初创团队是 360 基础架构,于 2015 年开源(开源地址:GitHub - OpenAtomFoundation/pika: Pika is a nosql compatible with redis, it is developed by Qihoo's DBA and infrastructure team),并捐赠给了开放原子开源基金会。

2021 年 6 月,Pika 成为开放原子开源基金会的一个孵化项目之一,正式走向了社区自治

图 1 Pika 简介

 

2、Pika 发展过程

图 2 发展过程及 github 上的 star trend

什么是键值数据库

1、键值数据库定义

首先键值数据库可以从这三个方面来理解。

  • 键值数据库是一种非关系数据库,它使用简单的键值方法来存储数据。

  • 键值数据库将数据存储为键值对集合,其中键作为唯一标识符。键和值都可以 是从简单对象到复杂复合对象的任何内容。

  • 键值数据库是高度可分区的,并且允许以其他类型的数据库无法实现的规模进 行水平扩展。

如果将键值数据库的概念外扩,就变成了广义的“键值存储”的概念,比如图片存储、小文件存储、对象存储。

2、键值数据库分类

键值数据库内部分为四大类,缓存 &持久化、商业 &开源、有序 &无序、大 Value&小 Value,侧面说明该领域是有需求的,每个分类中有很好的例子存在。

图 3 KV 数据库内部分类

键值数据库的优势

那么键值数据库和其他数据库存储相比,是否有优势呢?我将数据库存储分为了三个大类,关系数据库、NoSQL、数据存储。KV 数据库属于 nosql 这一类。

图 4 KV 在数据库与存储中的位置

这里我尝试引入“递弱代偿”的理论,应用于数据库领域中,便是:越简单的系统适用场景越宽广,越复杂的系统适用场景越少

对于 KV 数据库而言,它的逻辑简单,解决问题更灵活,适用的场景更广;而对于专业性强的数据库(关系数据库 & NewSQL & 搜索数据库 & 图数据库 & 向量数 据库等):解决的问题更专业,适用场景更少。

1、可构建多种应用场景

接下来将从几个方面来举例分析键值数据库在理论中的应用情况。


图 5 KV 数据库可构建多种应用场景

KV 数据库本身提供多种接口。它支持不同的如 KEY-STRING、KRY-HASH、 KEY-LIST 的接口,满足不同场景的需求。

比如 KEY-STRING 的接口应用于搜索推荐、机器学习;;KRY-HASH 接口应用于比较复杂的业务场景,比如用户信息、好友推荐、对象存储元数据; KEY-LIST 构建一个简单且高效的消息中间件,使应用程序能够很容易的进行异步的扩展,也可以打造一个分布式的任务系统。

基于 KV 数据库可以做简单的编程,用户可以通过简单的编程来适配他的业务。

2、可构建其它数据库和基础软件

目前很多的基础设施和数据库,是基于 KV 数据库来构建的,比如关系数据库,向量数据库,图数据库,流数据库,分析数据库,消息队列。 因此 kV 数据库的生存能力与价值是很大的,可以是构建其他数据库的基础。

图 6 可基于 KV 数据库构建其它数据库和基础软件

KV 数据库,云时代下的文件存储

通过刚才的例子,可能有朋友会认为,KV 数据库就等于通用文件存储,它们是否是一样的呢?

这里我从解决问题、使用场景、开发效率、开发难度、云支持五个角度对两者做了比较。

图 7 通用文件存储 VS KV 存储

在云的时代下,大家在存储数据的过程中已经抛弃掉了文件存储的使用工具,开始通过数据库解决。数据库的分类众多,如何满足不同用户不限的需求与特定的场景?

在这样的背景下,可以通过 KV 数据库或者 KV 存储来解决用户在自定义的一些逻辑,从而满足他们的场景。

在未来的云上中,除了特定的场景以外,KV 数据库便是除特定场景以外的补充,所以我认为 KV 在未来的云上中非常有前景。因此我们要解决的问题就是:如何通过 KV 数据库更好地满足开发者的开发效率、开发成本、使用成本的问题


以上就是我的分享。感谢聆听


更多精彩内容,欢迎大家观看现场视频回放与会议资料 视频回放:https://www.modb.pro/video/6183 会议资料:https://www.modb.pro/doc/58204



墨天轮,围绕数据人的学习成长提供一站式的全面服务,打造集新闻资讯、在线问答、活动直播、在线课程、文档阅览、资源下载、知识分享及在线运维为一体的统一平台,持续促进数据领域的知识传播和技术创新。

关注官方公众号: 墨天轮、 墨天轮平台、墨天轮成长营、数据库国产化 、数据库资讯

发布于: 刚刚阅读数: 2
用户头像

墨天轮

关注

数据库技术爱好者 2019.11.22 加入

墨天轮社区围绕数据人的学习成长提供一站式的全面服务。我们的愿景是共同建设一个有温度的技术社区和全新的数据社群聚合体,以乐知乐享之志,成同心共济之果。

评论

发布
暂无评论
墨天轮访谈 | Pika数据库陈磊:云时代下,键值数据库是否会被替代?_数据库_墨天轮_InfoQ写作平台