写点什么

sqoop 如何指定 pg 库的模式

  • 2022 年 1 月 22 日
  • 本文字数:2840 字

    阅读完需:约 9 分钟

摘要:sqoop 如何指定 pg 库的模式?

 

本文分享自华为云社区《【Hadoop】关于Sqoop导出数据到postgresql时schema的设置问题》,作者:Copy 工程师 。

说明

 

使用 sqoop 导出导入数据非常的方便,但是对于 postgresql(简称 PG 库)时就碰到了一个问题,pg 库是三层结构的 database——schema——table。如果想导入到某一个模式下,那就需要指定模式才可以。但是 sqoop 如何指定 pg 库的模式?

解决办法

 

碰到问题首先要看文档才对的。文档这里已经指出如何指定 pg 库的 schema 了。官方文档地址文档已经说了,如果向指定 schema 需要添加-- --schema <name> 但是要注意的是必须在命令行的 !!!!最后!!! 添加才会生效。

 

 

但是,这是命令行的解决办法,如果我们使用的是 java 呢?在没解决之前,我的 java 代码是这样写的:

 

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始任务",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }
复制代码

 

结果当然是不成功。那我哦添加-- --schema 参数试一下

 

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始任务",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            list.add("-- --schema");            list.add("HERO");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }
复制代码

 

结果也是不成功,显示报错不识别-- --schema 。。。为了能够使 schema 参数生效,废了我不少劲。。。也查了不少资料,但是查到的资料都没有关于 java 的 schema 的设置。所以。。。最终正确的解决办法是:

 

public static boolean ExportCmdInPg(Configuration conf, String tableName, List<String> columns, String hdfsDir,Map<String, String> dbMap) {        try {            LogUtils.logInfoPrint("开始sqoop将oracle的数据导出到HDFS目录",logger);            List<String> list = new ArrayList<>();            list.add("--connect");            list.add(dbMap.get(Constant.DRIVERURL));            list.add("--username");            list.add(dbMap.get(Constant.USER));            list.add("--password");            list.add(dbMap.get(Constant.PASSWORD));            list.add("--table");            list.add(tableName);            list.add("--columns");            list.add(StringUtils.join(columns, ','));            list.add("--fields-terminated-by");            list.add("\t");            list.add("--export-dir");            list.add(hdfsDir);            list.add("-m");            list.add("1");            // 注意这里是--是分开的,源码这里是通过--做判断的            list.add("--");            list.add("--schema");            list.add("HERO");            ExportTool exporter = new ExportTool();            Sqoop sqoop = new Sqoop(exporter);            String[] data = list.toArray(new String[0]);            if (0 == data.length) {                LogUtils.logErrorPrint("sqoop参数为空,请检查ExportCmd方法!",logger);                return false;            }            if (0 == Sqoop.runSqoop(sqoop, data)){                return true;            }        }catch (Exception e){            LogUtils.logErrorPrint("ExportCmd 导入到HDFS出现错误",logger,e);        }        return false;    }
复制代码

 

当然你也可能会使用字符串数组,数组方式就要这样写了

 

// 这里只是举个示例String[] string = new String[]{"--","--schema","HERO"}
复制代码

 

so 问题解决,心情愉快。如果问题不解决,可能会憋一天。。。。

 

点击关注,第一时间了解华为云新鲜技术~

发布于: 刚刚阅读数: 2
用户头像

提供全面深入的云计算技术干货 2020.07.14 加入

华为云开发者社区,提供全面深入的云计算前景分析、丰富的技术干货、程序样例,分享华为云前沿资讯动态,方便开发者快速成长与发展,欢迎提问、互动,多方位了解云计算! 传送门:https://bbs.huaweicloud.com/

评论

发布
暂无评论
sqoop如何指定pg库的模式