Databend 玩转 local 模式
目前开发者们需要尝鲜 databend, 可以选择使用 databend cloud 或者按官方文档部署 databend 服务。 由于 databend 架构有三层,因此部署 databend 服务一般需要启动 databend-query
, databend-meta
, minio
三个进程,同时需要修改端口等配置项,流程上略显复杂。 有没有更快的方式可以快速尝鲜 databend 呢?
Python binding
一种快速的方式是将 databend 跑在 python 中,借助 rust 优良的生态,我们基于 pyo3 库发布了 python binding,可以在本地 juypter 或者 colab 等在线服务中使用 databend:
Databend local 模式
借鉴于 clickhouse-local
, duckdb
等嵌入型数据库的优点,我们在 databend 中也可以开启 local 模式。
local
模式 是一个 databend 的简易版本,用户无需部署 databend 服务即可在命令中 用 SQL 和 databend 交互。它的好处在于简化了开发安装,同时方便开发者们用 SQL 使用 databend 支持的功能进行简单的数据处理。 如果你需要在生产环境使用 databend,我们建议按官网推荐部署 databend 服务 或 databend cloud,但如果你是开发人员 或 测试工程师,你可以使用 local
模式 来玩转 databend。
local
模式 将启动一个临时的 databend-query 进程,这个进程融合了 客户端 和 服务端,并且他的存储是在临时目录中,生命周期跟随进程,进程离开后资源也将销毁,你可以在一个服务器中启动多个 local
进程,他们的资源是相互隔离的。
下面通过例子介绍一下,每个例子都是简短的几行命令,介绍local
模式可以实现什么功能。
在这之前,你需要下载 databend-query 二进制,然后将二进制放到 PATH 环境变量中,植入 bend-local
工具别名
命令行交互(REPL) 模式
直接在终端输入 bend-local 这一行命令后,我们将进入 REPL 模式,这里融合了客户端和服务端,类似 duckdb cli 工具使用。
Shell pipe 模式分析数据, $STDIN 宏将解析 stdin 流作为一个临时 stage 表
分析系统进程 ,找出每个用户占用的内存
其他好玩的分析例子,等待你的挖掘
版权声明: 本文为 InfoQ 作者【Databend】的原创文章。
原文链接:【http://xie.infoq.cn/article/dadc6d58432af1fe8434499ee】。文章转载请联系作者。
评论