【我和 openGauss 的故事】kettle 连接 openGauss 5.0.0 数据库
IT 烧麦 [openGauss](javascript:void(0);) 2023-07-29 17:58 发表于四川
前言
Kettle 介绍(来源百度百科)
Kettle 最早是一个开源的 ETL 工具,全称为 KDE Extraction, Transportation, Transformation and Loading Environment。在 2006 年,Pentaho 公司收购了 Kettle 项目,原 Kettle 项目发起人 Matt Casters 加入了 Pentaho 团队,成为 Pentaho 套件数据集成架构师 [1] ;从此,Kettle 成为企业级数据集成及商业智能套件 Pentaho 的主要组成部分,Kettle 亦重命名为 Pentaho Data Integration [1-2]。Pentaho 公司于 2015 年被 Hitachi Data Systems 收购。(Hitachi Data Systems 于 2017 年改名为 Hitachi Vantara [4] )
Pentaho Data Integration 以 Java 开发,支持跨平台运行,其特性包括:支持 100%无编码、拖拽方式开发 ETL 数据管道;可对接包括传统数据库、文件、大数据平台、接口、流数据等数据源;支持 ETL 数据管道加入机器学习算法。
Pentaho Data Integration 分为商业版与开源版,开源版的截止 2021 年 1 月的累计下载量达 836 万,其中 19%来自中国 。在中国,一般人仍习惯把 Pentaho Data Integration 的开源版称为 Kettle。
一、openGuass 5.0.0 的安装
openGauss 的安装参加下面的链接
1、openGauss 5.0.0 安装
《基于openEuler 22.03LTS 安装 单机openGauss 5.0.0企业版数据库》
2、openGauss 3.1.0 安装
《手把手教你安装 openGauss 3.1.0》:https://www.modb.pro/db/545504
二、kettle 的安装
2.1、下载
下载 pdi-ce-9.4.0.0-343.zip

官方文档地址:https://www.hitachivantara.com/en-us/pdf/implementation-guide/three-steps-to-install-pentaho-data-integration-ce.pdf
2.2、安装 kettle
操作系统:centos7.9
2.2.1 先决条件
需要 64 位 Java SE 版本 jave SE 11 到 18 都可以
对于 Linux/Ubuntu 安装,还需要安装 libwebkitgtk-1.0-0 才能使 PDI 正常运行。
安装一些依赖包
下载安装 xulrunner:https://www.modb.pro/doc/112883
2.2.2 解压安装包
创建目录并解压
查看文件

启动 kettle 到图形化界面下执行
启动过程
启动完成
三、配置连接
3.1 下载 jar 包
openGauss jar 包下载地址

把 openGauss-5.0.0-JDBC.tar.gz 解压到 data-integration/lib 下面
3.2 添加配置
在 data-integration/simple-jndi/jdbc.properties 加入以下内容
3.3 在图形化中配置
点击 connect
点击 Repository Manager
点击 Add
点击 Database Repository
填写 display name
点击 Create

填写下面内容

点击测试
连接成功
后面依次点击确认和 save
3.4 连接 openGauss 数据库
点击 connect 、然后选择刚才创建的名称

输入默认用户密码:admin/admin
评论