MySQL 数据同步至 S3file,并接入 Hive 访问:SeaTunnel 实践指南

作者 | 番兄
如何借助 Apache SeaTunnel 将 MySQL 数据高效同步至 S3file?本文详述的步骤已全部通过测试验证,适用于构建基于对象存储的数据中台场景,具备部署灵活、扩展性强等优势,对有 MySQL 到 S3 数据集成需求的用户具有较高的参考价值,点赞、收藏学习吧!
第一步:创建 Hive 表
复制代码
注意:
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\001'
这个分隔符设置需要在后面 SeaTunnel 里面配置一样的,不然格式错误;'parquet.compression'='ZSTD'
压缩算法也是需要在后面 SeaTunnel 里面配置一样的;STORED AS PARQUET
parquet 文件格式,也是需要在后面 SeaTunnel 里面配置一样的.
是用之前把注释删除
复制代码
第二步:执行 SeaTunnel 同步,并在 Hive 查询里执行下列操作
复制代码
第三步:创建 Doris Hive catalog 外部库
复制代码
说明:
因为本人用的 CDH6.3.2 版本,Hive 是 2.1.1 版本,所以建立 catalog 的时候,需要指定
"hive.version" = '2.1.1'
。因为本人设置的 minio 没有 ssl,所以配置的时候需要加上
"s3.connection.ssl.enabled" = "false"
。Minio 用的是 path 风格,所以需要配置
"use_path_style" = "true"
。SeaTunnel 版本: 2.3.11
Doris 版本:2.0.15
版权声明: 本文为 InfoQ 作者【白鲸开源】的原创文章。
原文链接:【http://xie.infoq.cn/article/db9e1918e5cb38ea92d738929】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论