写点什么

手把手入门 MO | 如何使用 DolphinScheduler 连接 MatrixOne

作者:MatrixOrigin
  • 2024-01-03
    上海
  • 本文字数:1921 字

    阅读完需:约 6 分钟

1 概述

Apache DolphinScheduler 是一个分布式、易扩展的可视化 DAG 工作流任务调度开源系统。它提供了一种解决方案,可以通过可视化操作任务、工作流和全生命周期的数据处理过程。

Apache DolphinScheduler 的主要目标是解决复杂的大数据任务依赖关系。它使用 DAG(Directed Acyclic Graph,有向无环图)的流式方式来组装任务,允许您实时监控任务的执行状态,支持任务重试、指定节点恢复失败、暂停、恢复、终止等操作。

MatrixOne 支持与可视化 DAG 工作流任务调度系统 DolphinScheduler 进行连接。本文将指导您如何通过 DolphinScheduler 连接到 MatrixOne 并创建任务工作流。


2 开始前准备

  • 已完成安装和启动 MatrixOne。

  • 已完成安装 DolphinScheduler。


3 配置 MySQL 驱动

1. 下载 MySQL 驱动并将其复制到 libs 目录

在安装完成后,您需要手动下载 mysql-connector-java 驱动(版本 8.0.16),然后将它分别复制到 DolphinScheduler 安装目录下的四个目录中:api-server/libs、alert-server/libs、master-server/libs 和 worker-server/libs。


Note

推荐使用 `mysql-connector-java-8.0.16.jar` 作为 MySQL 驱动包。


2. 重启 DolphinScheduler

复制驱动包完成后,需要重启 DolphinScheduler 服务。首先进入 DolphinScheduler 的安装目录,然后执行以下命令来重启 DolphinScheduler 服务:

# 停止 Standalone Server 服务bash ./bin/dolphinscheduler-daemon.sh stop standalone-server# 启动 Standalone Server 服务bash ./bin/dolphinscheduler-daemon.sh start standalone-server
复制代码

3. 登录 DolphinScheduler

使用默认用户名 admin 和密码 dolphinscheduler123,通过访问 http://ip:12345/dolphinscheduler/ui 登录 DolphinScheduler 的 Web 用户界面,如下图所示:


4. 创建数据源

点击数据源中心 > 创建数据源,填写 MatrixOne 数据连接信息。完成后,点击测试连接,如果连接成功,点击确定保存:

4 创建项目工作流

1. 创建租户

安全中心中,点击创建租户,填写租户名称,如下图所示:


Note

在生产环境中,不建议使用root作为租户。


2. 创建项目

项目管理中,点击创建项目,填写项目名称,如下图所示:

3. 创建工作流并添加节点

点击上一步创建的项目名称,然后点击创建工作流。从左侧拖动 SQL 节点到右侧的画布上,填写节点名称、数据源信息、SQL 类型、SQL 语句,然后点击确定。如下图所示:

此步骤创建的是一个建表节点,SQL 语句用于创建表格。

接下来,类似地创建插入数据查询数据节点。这三个节点的依赖关系如下图,您可以手动连接它们:

三个节点的 SQL 语句如下:

#create_tableCREATE TABLE IF NOT EXISTS test_table (id INT AUTO_INCREMENT PRIMARY KEY, nameVARCHAR(255) NOT NULL)#insert_dataINSERT INTO test_table (name) VALUES ('John Doe')#select_dataSELECT * FROM test_table
复制代码

根据依赖关系连接这三个节点,然后点击保存。填写工作流名称,选择之前创建的租户,选择执行策略为并行,然后点击确定

创建好工作流后,您可以在工作流关系页面看到创建的工作流,其状态为工作流下线

同样,您也可以在工作流定义页面看到定义的工作流,其状态为下线

4. 上线并运行工作流

工作流必须先上线才能运行。点击上线按钮,将之前创建的工作流上线:

上线后,工作流的状态如下图所示:

接下来,点击运行按钮,设置启动前的配置参数,然后点击确定:

最后,返回项目概况,查看工作流以及下面的三个任务是否成功运行,如下图所示:



关于 MatrixOne

MatrixOne 是一款基于云原生技术,可同时在公有云和私有云部署的多模数据库。该产品使用存算分离、读写分离、冷热分离的原创技术架构,能够在一套存储和计算系统下同时支持事务、分析、流、时序和向量等多种负载,并能够实时、按需的隔离或共享存储和计算资源。云原生数据库 MatrixOne 能够帮助用户大幅简化日益复杂的 IT 架构,提供极简、极灵活、高性价比和高性能的数据服务。

MatrixOne 企业版和 MatrixOne 云服务自发布以来,已经在互联网、金融、能源、制造、教育、医疗等多个行业得到应用。得益于其独特的架构设计,用户可以降低多达 70%的硬件和运维成本,增加 3-5 倍的开发效率,同时更加灵活的响应市场需求变化和更加高效的抓住创新机会。在相同硬件投入时,MatrixOne 可获得数倍以上的性能提升。

MatrixOne 秉持开源开放、生态共建的理念,核心代码全部开源,全面兼容 MySQL 协议,并与合作伙伴打造了多个端到端解决方案,大幅降低用户的迁移

关键词:超融合数据库、多模数据库、云原生数据库、国产数据库。

MatrixOrigin 官网:新一代超融合异构开源数据库-矩阵起源(深圳)信息科技有限公司 MatrixOne

Github 仓库:GitHub - matrixorigin/matrixone: Hyperconverged cloud-edge native database

发布于: 刚刚阅读数: 5
用户头像

MatrixOrigin

关注

还未添加个人签名 2021-12-06 加入

一个以技术创新和用户价值为核心的基础软件技术公司。

评论

发布
暂无评论
手把手入门 MO | 如何使用 DolphinScheduler 连接 MatrixOne_分布式数据库_MatrixOrigin_InfoQ写作社区