写点什么

Ubuntu 22 下 DolphinScheduler 3.x 伪集群部署实录

作者:白鲸开源
  • 2025-09-18
    天津
  • 本文字数:2237 字

    阅读完需:约 7 分钟

本文记录了在 Ubuntu 22.04 上部署 Apache DolphinScheduler(伪集群模式)的完整过程,涵盖环境准备、安装配置、数据库初始化、用户创建及服务启动等步骤。适合个人学习、功能验证或测试使用。

环境准备

1. 安装 Java 8

DolphinScheduler 目前仅支持 Java 8 或 Java 11,不兼容 Java 17 及以上版本。这里选择安装 OpenJDK 8:


sudo apt updatesudo apt install openjdk-8-jdk -y
复制代码


配置环境变量,可写入/etc/profile.d/java.sh或用户 .bashrc文件:


export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64export PATH=$JAVA_HOME/bin:$PATH
复制代码


验证 Java 安装:


java -version
复制代码

2. 安装 ZooKeeper

ZooKeeper 是 DolphinScheduler 的注册中心组件,所有 Master 和 Worker 节点都依赖它进行调度与注册。


建议先单机部署一个 ZooKeeper 服务。


简单步骤如下:


# 下载并解压wget https://dlcdn.apache.org/zookeeper/zookeeper-3.9.3/apache-zookeeper-3.9.3-bin.tar.gztar -xzf apache-zookeeper-3.9.3-bin.tar.gzmv apache-zookeeper-3.9.3-bin /opt/zookeeper
# 创建配置文件cp /opt/zookeeper/conf/zoo_sample.cfg /opt/zookeeper/conf/zoo.cfg
# 启动服务/opt/zookeeper/bin/zkServer.sh start
复制代码

3. 安装 PostgreSQL

使用官方 APT 源在 Ubuntu 22.04 上安装 PostgreSQL。

部署 DolphinScheduler

1. 下载并解压安装包

从官网下载对应版本的二进制安装包,也可以直接使用命令:


wget https://dlcdn.apache.org/dolphinscheduler/3.2.1/apache-dolphinscheduler-3.2.1-bin.tar.gztar -xzf apache-dolphinscheduler-3.2.1-bin.tar.gzmv apache-dolphinscheduler-3.2.1-bin dolphinschedulercd dolphinscheduler
复制代码

2. 修改配置文件

DolphinScheduler 启动时会读取 bin/env/dolphinscheduler_env.sh中的环境变量配置。根据你的环境修改以下内容:


export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
# 数据库配置export DATABASE=postgresqlexport SPRING_PROFILES_ACTIVE=${DATABASE}export SPRING_DATASOURCE_URL="jdbc:postgresql://127.0.0.1:5432/dolphinscheduler"export SPRING_DATASOURCE_USERNAME=dolphinschedulerexport SPRING_DATASOURCE_PASSWORD=dolphinscheduler
# ZooKeeper 注册中心export REGISTRY_TYPE=zookeeperexport REGISTRY_ZOOKEEPER_CONNECT_STRING=localhost:2181
# 其他通用配置export SPRING_CACHE_TYPE=noneexport SPRING_JACKSON_TIME_ZONE=UTC
复制代码


Hadoop、Spark、Flink 等任务相关配置可按需注释或保留默认值。

3. 创建部署用户

为 DolphinScheduler 创建独立的系统用户:


sudo useradd -m -d /home/dolphinscheduler -s /bin/bash dolphinschedulerecho "dolphinscheduler:dolphinscheduler" | sudo chpasswd
复制代码


设置 sudo 免密权限(推荐用 sudoers.d 方式):


echo "dolphinscheduler ALL=(ALL) NOPASSWD: ALL" | sudo tee /etc/sudoers.d/dolphinschedulerchmod 440 /etc/sudoers.d/dolphinscheduler
复制代码


给当前安装目录授权:


sudo chown -R dolphinscheduler:dolphinscheduler dolphinscheduler
复制代码

初始化数据库(PostgreSQL)

DolphinScheduler 默认不会自动初始化数据库结构,因此推荐手动执行 SQL 脚本。否则在首次启动时会因为表不存在而报错。


数据库创建步骤如下:


sudo -u postgres psql
-- 创建用户与数据库CREATE USER dolphinscheduler WITH PASSWORD 'dolphinscheduler';CREATE DATABASE dolphinscheduler OWNER dolphinscheduler;\q
复制代码


然后执行初始化脚本:


psql -U dolphinscheduler -d dolphinscheduler -f tools/sql/postgresql/dolphinscheduler_postgresql.sql
复制代码


如果你找不到 SQL 文件,可在源码或 GitHub release 分支中找到,路径通常是:


dolphinscheduler-dao/src/main/resources/sql/dolphinscheduler_postgresql.sql
复制代码


例如 3.2.2 对应地址:https://github.com/apache/dolphinscheduler/blob/3.2.2-release/dolphinscheduler-dao/src/main/resources/sql/dolphinscheduler_postgresql.sql

启动服务

切换到部署用户,进入 DolphinScheduler 安装目录后,依次启动以下模块:


su - dolphinschedulercd ~/dolphinscheduler
# 启动各模块bash bin/dolphinscheduler-daemon.sh start master-serverbash bin/dolphinscheduler-daemon.sh start worker-serverbash bin/dolphinscheduler-daemon.sh start api-serverbash bin/dolphinscheduler-daemon.sh start logger-server
复制代码

验证部署

  • 打开浏览器访问:http://<服务器 IP>:12345/dolphinscheduler

  • 默认账号密码:admin / dolphinscheduler123

  • 查看日志排错:日志文件在 logs/ 目录下,包含所有模块的启动与运行信息。

总结


参考链接


  • DolphinScheduler 官网 https://dolphinscheduler.apache.org/zh-cn/

  • 3.2.2 安装文档(伪集群) https://dolphinscheduler.apache.org/zh-cn/docs/3.2.2/guide/installation/pseudo-cluster

  • PostgreSQL 官方文档 https://www.postgresql.org/docs/

  • ZooKeeper 官方下载 https://zookeeper.apache.org/releases.html

  • GitHub SQL 初始化路径示例 https://github.com/apache/dolphinscheduler/blob/3.2.2-release/dolphinscheduler-dao/src/main/resources/sql/dolphinscheduler_postgresql.sqlhttps://github.com/apache/dolphinscheduler/blob/3.2.2-release/dolphinscheduler-dao/src/main/resources/sql/dolphinscheduler_postgresql.sql


原文链接:https://blog.csdn.net/kaka_buka/article/details/149511194

发布于: 刚刚阅读数: 3
用户头像

白鲸开源

关注

一家开源原生的DataOps商业公司。 2022-03-18 加入

致力于打造下一代开源原生的DataOps 平台,助力企业在大数据和云时代,智能化地完成多数据源、多云及信创环境的数据集成、调度开发和治理,以提高企业解决数据问题的效率,提升企业分析洞察能力和决策能力。

评论

发布
暂无评论
Ubuntu 22 下 DolphinScheduler 3.x 伪集群部署实录_Java_白鲸开源_InfoQ写作社区