写点什么

【我和 openGauss 的故事】使用 Ora2Pg 迁移 oracle 数据到 openGauss

作者:daydayup
  • 2023-08-08
    北京
  • 本文字数:7184 字

    阅读完需:约 24 分钟

【我和 openGauss 的故事】使用 Ora2Pg 迁移 oracle 数据到 openGauss

DemonCharm [openGauss](javascript:void(0);) 2023-08-04 18:01 发表于四川

前言

本博客介绍了使用 Ora2Pg 迁移 oracle 数据到 openGauss




1、下载及安装 Ora2Pg


1.1、下载说明:


Perl DBD: http://search.CPAN.org      #只需在搜索输入框中输入模块的全名(例如:DBD::Oracle、DBD::Pg)Ora2Pg:https://ora2pg.darold.net/start.html
在Windows下,应该安装Strawberry Perl(http://strawberryperl.com)和操作系统对应的Oracle客户机。在Windows上从CPAN编译DBD::Oracle似乎是一件很困难的事情,而且关于这方面的文档很少(大部分都过时了,不能工作)。安装ActiveState Perl的免费版本(http://www.ActiveState.com/activeperl)可能会有所帮助,因为它们似乎已经打包好了DBD::Oracle,易于安装。
必须在系统上安装 Oracle Instant Client 或完整的 Oracle 安装。您可以从 Oracle 下载中心下载 RPM:rpm -ivh oracle-instantclient12.2-basic-12.2.0.1.0-1.x86_64.rpmrpm -ivh oracle-instantclient12.2-devel-12.2.0.1.0-1.x86_64.rpmrpm -ivh oracle-instantclient12.2-jdbc-12.2.0.1.0-1.x86_64.rpmrpm -ivh oracle-instantclient12.2-sqlplus-12.2.0.1.0-1.x86_64.rpm或者只需从 Oracle 下载中心下载相应的 ZIP 存档并将它们安装在您想要的位置,例如:/opt/oracle/instantclient_12_2/
需要一个现代的Perl发行版(perl 5.10及更高版本)。要连接到数据库并继续迁移,您需要 DBI Perl 模块> 1.614。要迁移 Oracle 数据库,您需要安装 DBD::Oracle Perl 模块。要迁移MySQL数据库,您需要DBD::MySQL Perl模块。这些模块用于连接到数据库,但如果要迁移 DDL 输入文件,则它们不是必需的。
默认情况下,Ora2Pg 将导出转储到平面文件,要将它们加载到 PostgreSQL 数据库中,您需要 PostgreSQL 客户端(plsql)。如果在运行 Ora2Pg 的主机上没有该文件,则始终可以将这些文件传输到安装了 psql 客户端的主机上。如果你更喜欢“动态”加载导出,则需要perl模块DBD::Pg。Ora2Pg 允许您将所有输出转储到压缩的 gzip 文件中,为此您需要 Compress::Zlib Perl 模块。如果您更喜欢使用 bzip2 压缩,则程序 bzip2 必须在您的 PATH 中可用。
复制代码


1.2、安装说明:


执行以下命令安装:-------------------------------yum -y install perl perl-CPAN gcc perf cpan

安装ora2pg:-------------------------------tar xjf ora2pg-x.x.tar.bz2cd ora2pg-x.x/perl Makefile.PLmake && make installPS:这将把Ora2Pg.pm安装到站点Perl存储库中,Ora2Pg安装到/usr/local/bin/中,Ora2Pg.conf安装到/etc/Ora2Pg/中。
复制代码


1.3、安装 ora2pg 到其他目录


-------------------------------tar xjf ora2pg-x.x.tar.bz2cd ora2pg-x.x/perl Makefile.PL PREFIX=<your_install_dir>make && make installexport PERL5LIB=<your_install_dir>ora2pg -c config/ora2pg.conf -t TABLE -b outdir/
复制代码


1.4、安装 DBD::Oracle


-------------------------------将ORACLE_HOME和LD_LIBRARY_PATH环境变量设置为 root 用户后,安装 DBD::Oracle进入:http://search.CPAN.org/ 搜索DBD::Oracle,下载;
修改root用户的环境变量:-------------------------------vi .bash_profileexport LD_LIBRARY_PATH=/oracle/app/oracle/product/11.2.0/db_1/libexport ORACLE_HOME=/oracle/app/oracle/product/11.2.0/db_1export PATH=/oracle/app/oracle/product/11.2.0/db_1/bin:$PATH
source /root/.bash_profiletar -zxvf DBD-Oracle-1.80.tar.gz
cd DBD-Oracle-1.80perl Makefile.PLmakemake install
复制代码


1.5、错误信息参考:


1.5.1、错误提示:


-------------------------------[root@luozhonghua FCGI-0.71]# perl Makefile.PL
can't locate ExtUtils/MakeMaker.pm in @INC (@INC contains: /usr/local/lib/perl5 /usr/local/share/perl5/usr/lib/perl5/vendor_perl /usr/share/perl5/vendor_perl /usr/lib/perl5 /usr/share/perl5 .) at Makefile.PL line 3.BEGIN failed--compilation aborted at Makefile.PL line 3.
解决方法:-------------------------------这句显示ExtUtils/MakeMaker.pm没有安装,执行以下命令安装:yum -y install perl perl-CPAN gcc
复制代码


1.5.2、错误提示:


-------------------------------[root@oracle DBD-Oracle-1.80]# perl Makefile.PLCan't locate DBI.pm in @INC (@INC contains: /usr/local/lib64/perl5 /usr/local/share/perl5 /usr/lib64/perl5/vendor_perl /usr/share/perl5/vendor_perl /usr/lib64/perl5 /usr/share/perl5 .)at Makefile.PL line 20.BEGIN failed--compilation aborted at Makefile.PL line 20.
解决方法:-------------------------------安装DBI-1.643 进入:http://search.CPAN.org/ 搜索dbi,下载;tar -zxvf DBI-1.643.tar.gzcd DBI-1.643perl Makefile.PLmake && make install
复制代码


2、使用 Ora2Pg 生成迁移模板


2.1、使用 ora2pg 初始化一个项目模板


-------------------------------ora2pg --project_base /ora2pg --init_project test_project-------------------------------Creating project test_project./app/migration/test_project/schema/dblinks/directories/functions/grants/mviews/packages/partitions/procedures/sequences/synonyms/tables/tablespaces/triggers/types/views/sources/functions/mviews/packages/partitions/procedures/triggers/types/views/data/config/reports/Generating generic configuration fileCreating script export_schema.sh to automate all exports.Creating script import_all.sh to automate all imports.
复制代码


示例生成了一个通用的配置文件,只需要在其中指定 Oracle 数据库连接信息;同时还生成了一个脚本文件 export_schema.sh。目录 sources/ 包含 Oracle 代码目录 schema/ 包含移植到 PostgreSQL 的代码目录 reports/ 包含带有迁移成本评估的 html 报告
如果要使用自己的默认配置文件,请使用-c选项指定该文件的路径。
设置与 Oracle 数据库的连接后,可以执行脚本export_schema.sh 该脚本将从 Oracle 数据库导出所有对象类型,并将 DDL 文件输出到架构的子目录中。在导出结束时,它将在稍后完成并验证架构导入时为您提供导出数据的命令。您可以选择加载手动生成的 DDL 文件,也可以使用第二个脚本import_all.sh以交互方式导入这些文件。
复制代码


2.2、通过更新 oracle 上的统计信息,可能提高性能:


BEGINDBMS_STATS.GATHER_SCHEMA_STATSDBMS_STATS.GATHER_DATABASE_STATSDBMS_STATS.GATHER_DICTIONARY_STATSEND;
复制代码


2.3、修改 ora2pg.conf 参考:


ORACLE_HOME /u02/app/oracle/product/11.2.4/db1ORACLE_DSN dbi:Oracle:host=192.168.56.2;sid=orcl;port=1521;ORACLE_USER systemORACLE_PWD system_123456SCHEMA liuzitao #需要导出的业务用户名称USER_GRANTS 0 #ORACLE_USER 有DBA权限设置为0,否则1DEBUG 0ORA_INITIAL_COMMANDEXPORT_SCHEMA 0CREATE_SCHEMA 1COMPILE_SCHEMA 0TYPE TABLEOUTPUT output.sql
复制代码


2.4、Oracle 相关参数:


ORACLE_HOME用于将环境变量设置为DBD::Oracle Perl模块所需的Oracle库ORACLE_HOME。-------------------------------ORACLE_DSN此指令用于以标准 DBI DSN 的形式设置数据源名称。例如:dbi:Oracle:host=oradb_host.myhost.com;sid=DB_SID;port=1521或dbi:Oracle:DB_SID 在 18c 上,例如:dbi:Oracle:host=192.168.1.29;service_name=pdb1;port=1521对于第二种表示法,SID 应在已知文件 $ORACLE_HOME/network/admin/tnsnames.ora 或提供给 TNS_ADMIN 环境变量的路径中声明。对于MySQL,DSN将像这样运行:dbi:mysql:host=192.168.1.10;database=sakila;port=3306 "SID"部分替换为"数据库"。-------------------------------ORACLE_USER and ORACLE_PWD这两个指令用于定义 Oracle 数据库连接的用户和密码。请注意,最好以 Oracle 超级管理员身份登录,以避免在数据库扫描期间出现授权问题,并确保没有遗漏任何内容。如果您没有提供带有ORACLE_PWD的凭据,并且您已经安装了 Term::ReadKey Perl 模块,Ora2Pg 将以交互方式询问密码。如果未设置ORACLE_USER,也会以交互方式询问。要连接到具有“sysdba”连接的本地 ORACLE 实例,您必须将ORACLE_USER设置为 "/" 并设置空密码。-------------------------------USER_GRANTS如果以简单用户身份连接 Oracle 数据库并且没有足够的授权从 "DBA_" 中提取内容,请将此指令设置为 1。它将使用表 "ALL_" 相反。警告:如果使用导出类型 GRANT,则必须将此配置选项设置为 0,否则它将不起作用。-------------------------------TRANSACTION该选项用于修改数据导出事务的默认隔离级别。现在默认的设置是序列化事务隔离级别,用于保证导出数据的一致性。以下是一些支持的设置:readonly: 'SET TRANSACTION READ ONLY',readwrite: 'SET TRANSACTION READ WRITE',serializable: 'SET TRANSACTION ISOLATION LEVEL SERIALIZABLE'committed: 'SET TRANSACTION ISOLATION LEVEL READ COMMITTED',6.2 版本之前的默认隔离级别为 READ ONLY,但是这种设置在某些情况下会破坏数据一致性,因此现在的默认设置为SERIALIZABLE。-------------------------------INPUT_FILE该参数不是用于设置 Oracle 数据库连接,它指定了一个输入文件,并且禁用了 Oracle 数据库连接。将该参数设置为一个包含了 Oracle PL/SQL 代码(例如函数、过程或者包)的文件,可以阻止 Ora2Pg 连接 Oracle 数据库,而是从该文件 and just apply his conversion tool to the content of the file.该选项可以用于大部分的导出类型:TABLE、TRIGGER、PROCEDURE、VIEW、FUNCTION 或者 PACKAGE等。-------------------------------ORA_INITIAL_COMMAND该选项用于建立 Oracle 数据库连接后,执行一个初始化命令。例如在读取对象信息之前关闭访问限制策略,或者设置某些会话参数。该选项支持多次设置。-------------------------------LOGFILE默认情况下,所有的消息都会发送到标准输出。如果为该选项指定一个文件路径,所有的输出信息将会追加到该文件中。-------------------------------ORACLE_COPIES此配置指令增加了多进程支持,以从 Oracle 提取数据。该值是用于并行化选择查询的进程数。默认值为禁用并行查询。并行性建立在将作为值给出的内核数的查询拆分为ORACLE_COPIES,如下所示:SELECT * FROM MYTABLE WHERE ABS(MOD(COLUMN, ORACLE_COPIES)) = CUR_PROC其中 COLUMN 是一个技术键,类似于主键或唯一键,其中拆分将基于该键以及查询使用的当前核心 (CUR_PROC)。在Windows操作系统下不起作用,它只是被禁用。-------------------------------DEFINED_PK此指令用于定义技术密钥,用于在使用ORACLE_COPIES变量设置的内核数之间拆分查询。例如:DEFINED_PK EMPLOYEES:employee_id假设 -J 或 ORACLE_COPIES 设置为 8 将使用的并行查询:SELECT * FROM EMPLOYEES WHERE ABS(MOD(employee_id, 8)) = N其中 N 是从 0 开始分叉的当前进程。-------------------------------PARALLEL_TABLES此指令用于定义将并行处理以进行数据提取的表数。限制是计算机上的核心数。Ora2Pg 将为每个并行表提取打开一个数据库连接。当此指令大于 1 时,将使 ORACLE_COPIES 无效,但不会使 JOBS 无效,因此将使用的实际进程数为 PARALLEL_TABLES * JOBS。请注意,如果要导出到文件,此指令在设置为 1 以上时也将自动启用 FILE_PER_TABLE 指令。这用于将表和视图导出到单独的文件中。-------------------------------DEFAULT_PARALLELISM_DEGREE您可以通过为此指令设置一个大于 2 的值,强制 Ora1Pg 在用于从 Oracle 导出数据的每个查询中使用 /*+ PARALLEL(tbname, degree) */ 提示。值为 0 或 1 将禁用并行提示。默认值已禁用。-------------------------------
复制代码


2.5、Oracle 数据加密传输:


如果 Oracle 客户端配置了加密连接,DBD:Oracle 也会使用该加密方式进行连接和数据传输。例如,将以下内容添加到 Oracle 客户端配置文件(sqlnet.ora 或 .sqlnet):
cat sqlnet.ora-------------------------------# Configure encryption of connections to OracleSQLNET.ENCRYPTION_CLIENT = requiredSQLNET.ENCRYPTION_TYPES_CLIENT = (AES256, RC4_256)SQLNET.CRYPTO_SEED = 'should be 10-70 random characters'
如果设置了上述加密传输,任何使用 Oracle 客户端连接到数据库的工具都会使用这种加密方式。
例如,Perl 的 DBI 模块通过DBD-Oracle 连接 Oracle 数据库,后者使用 Oracle 客户端连接数据库。如果 Oracle 客户端配置了加密连接,Perl 同样使用加密的方式连接 Oracle 数据库。
复制代码


2.6、Oracle 相关参数:


ORACLE_HOME /u01/app/oracle/product/11.2.0/ORACLE_DSN dbi:Oracle:host=oracleIP;sid=orcl;port=1521ORACLE_USER customerchat // 这里用的oracle普通用户和密码ORACLE_PWD XXXXXSCHEMA customerchat //一般和用户名一样
复制代码


2.7、openGauss 相关参数:


PG_DSN dbi:Pg:dbname=mydb;host=localhost;port=5432PG_USER tuserPG_PWD 自己定义的密码
复制代码


2.8、工具自身参数:


DATA_LIMIT 默认是10000,如果oracle服务器内存较小,比如4G以下,可以修改为2500或5000,否则可能会报内存不足。
复制代码


2.9、连接测试:


设置好 Oracle 数据库的 DSN 之后,可以执行以下命令测试数据库的连接:-------------------------------ora2pg -t SHOW_VERSION -c config/ora2pg.conf-------------------------------以上命令将会显示 Oracle 数据库的版本。
复制代码


2.10、测试迁移:


修改 export_schema.sh 中导出类型 EXPORT_TYPE 和 SOURCE_TYPE ,本次迁移导出 TABLE 。-------------------------------sh export_schema.sh-------------------------------执行完成后 在schema/tables生成 table.sql ,里面是建表脚本。reports/目录下生成的report报告report.html

导出COPY数据:-------------------------------ora2pg -t COPY -o data.sql -b ./data -c ./config/ora2pg.conf
复制代码


2.11、导入:


为了使用openGauss命令行工具gsql,需要将数据库的bin和lib加在操作系统的环境变量PATH和LD_LIBRARY_PATH中。-------------------------------将 import_all.sh 里的 psql 修改为 gsql-------------------------------

执行导入脚本,表示使用用户tuser登录openGauss中mydb的数据库,ip和端口,-f选项表示跳过用户和数据库是否需要创建的检查。-------------------------------sh import_all.sh -d mydb -o tuser -h openGaussIP -p 5432 -f
复制代码


2.12、ora2pg 只导入元数据:


./import_all.sh -a -d liuzitao -o liuzitao -p 5432./import_all.sh -a -d liuzitao -h 127.0.0.1 -o linl -n linl -p 5432./import_all.sh -a -h 127.0.0.1 -d liuzitao -o linl -p 5432
复制代码


2.13、错误信息:


1.报错:Path to pg_config? /opt/software/openGauss/bin/pg_config/opt/software/openGauss/bin/pg_config:error while loading shared libraries: libssl.so.1.1: cannot open shared object file: No such file or directory环境自带的是1.0.2,得升级libssl.so。
openssl version -a-------------------------------OpenSSL 1.0.2k-fips 26 Jan 2017yum remove openssl
获取新的版本并安装:-------------------------------wget https://www.openssl.org/source/openssl-1.1.1c.tar.gztar -zxvf openssl-1.1.1c.tar.gzcd openssl-1.1.1c./config --prefix=/usr/local/openssl #如果此步骤报错,需要安装perl以及gcc包make && make install-------------------------------ln -s /usr/local/openssl/lib/libssl.so.1.1 /usr/lib64/libssl.so.1.1ln -s /usr/local/openssl/lib/libcrypto.so.1.1 /usr/lib64/libcrypto.so.1.1ln -s /usr/local/openssl/bin/openssl /usr/bin/opensslln -s /usr/local/openssl/include/openssl /usr/include/opensslecho "/usr/local/openssl/lib" >> /etc/ld.so.confldconfig -v
sudo yum install postgresql-devel
再重新执行 perl -MCPAN -e 'install DBD::Pg'

-------------------------------2、perl 报错 Can’t locate JSON.pm in @INC解决:sudo perl -MCPAN -e 'install JSON'
-------------------------------3、执行sh import_all.sh -d mydb -o tuser -h IP -p 5432 -f 提示Out of memory , 但是top显示还有1G多。解决办法:Opened ./config/ora2pg.conf and modfied set DATA_LIMIT 5000 or 2500 solved the issue.
-------------------------------4、报错:DBD::Pg::db do failed: ERROR: permission denied for relation xxx解决办法:需要给openGauss的角色赋权限mydb=# grant all privileges to tuser;
-------------------------------5、报错:DBI connect('dbname=mydb;host=openGaussIP;port=5432','testuser',…) failed: connection to server at “openGaussIP”,port 5432 failed: none of the server’s SASL authentication mechanisms are supported at /opt/software/ora2pg/lib解决办法:这个错是openGauss返回的。需要修改 openGauss 的 pg_hba.conf 和 postgres.conf:修改 data/single_node/postgresql.conf 中 password_encryption_type = 1 。修改pg_hba.conf;
然后重启openGauss:-------------------------------gs_ctl restart -D /opt/software/openGauss/data/single_node
复制代码


用户头像

daydayup

关注

还未添加个人签名 2023-07-18 加入

还未添加个人简介

评论

发布
暂无评论
【我和openGauss的故事】使用Ora2Pg迁移oracle数据到openGauss_daydayup_InfoQ写作社区