写点什么

Aloudata BIG 主动元数据平台支持 Oracle/DB2 存储过程算子级血缘解析

作者:Aloudata
  • 2024-10-24
    四川
  • 本文字数:1098 字

    阅读完需:约 4 分钟

Aloudata BIG 主动元数据平台支持 Oracle/DB2 存储过程算子级血缘解析

Aloudata BIG 算子级血缘主动元数据平台已经支持 Oracle 类型、DB2 类型的存储过程算子级血缘解析,并达到 90% 血缘解析准确率:


  1. 能够识别准确的字段级数据加工依赖关系;

  2. 能够识别多级嵌套调用的存储过程的血缘;

  3. 能够推断存储过程内部变量的再加工取值;

  4. 能够从存储过程中提取出字段的主要加工口径。


存储过程的算子级血缘攻克了企业数据链路上的“断点和黑洞”,可以应用在国产数据库迁移、指标口径盘点、团队知识转移和运维故障快速定位等场景,进一步提升数据管理效率。


存储过程(即一种 PL/SQL 语言编写的执行程序)被广泛应用于 Oracle、SQL Server、Greenplum 、GaussDB、MySQL 等 MPP 数据库的数据处理任务中,它支持将任务指令发送至服务端,以更少的系统资源执行数据批量处理和复杂操作,让数据处理和分析效率更高,从而被企业众多关键系统及 ETL 开发人员使用。


然而,PL/SQL 相较于标准 SQL 而言,其引入了变量、流程控制、游标、动态 SQL 等更灵活、更复杂的高级语法,所以使用存储过程编写的数据处理任务,成为血缘解析的难点。部分企业通过规范写法、正则埋点等技术手段,实现了对存储过程血缘的部分解析,但在准确性和全面性上无法达到业务可用要求,导致只要涉及存储过程的数据处理任务,即使是表级血缘也存在“解不准、看不清”的情况,造成了数据链路的“断点和黑洞”


在国产数据库替代、监管升级的行业趋势下,企业在数据库迁移、数据质量保障等业务中,迫切需要具备支持存储过程在内的全链路、精细化血缘分析和代码理解能力,从而实现“全面国产化、自主可控、风险可控”等业务要求。


为解决上述难题,Aloudata BIG 主动元数据平台团队经过技术攻关,实现了对 Oracle 类型和 DB2 类型 PL/SQL 存储过程的算子级血缘解析,并在真实生产级环境中验证达到 90% 以上的准确率。团队通过自研 PL/SQL 语义分析引擎,实现了对变量、流程控制、游标、动态 SQL 等高级语法算子血缘及口径的语义分析,能够清晰、准确地获取存储过程内部的数据流转路径和字段计算逻辑等细节,可以帮助用户极大降低数据库迁移、复杂口径理解和代码知识转移难度,辅助实现自动化存储过程代码迁移等解决方案落地。


基于 Aloudata BIG,企业无论是在纯 SQL 场景,还是在存储过程调用场景,或混合 SQL 与 PL/SQL 代码块的场景,均能实现高准确率的算子级血缘解析和图谱构建,可以看清楚数据的来源、去向以及中间加工过程。未来,Aloudata BIG 还将支持 SQL Server 存储过程和 PostgreSQL 类型的存储过程血缘解析,并将存储过程的血缘准确率提升到 95%以上,满足企业全链路、精细化数据管理的需求。


进入Aloudata 官网,了解更多产品及最佳实践详情,期待您的关注、交流、分享与反馈。

用户头像

Aloudata

关注

还未添加个人签名 2024-01-22 加入

还未添加个人简介

评论

发布
暂无评论
Aloudata BIG 主动元数据平台支持 Oracle/DB2 存储过程算子级血缘解析_数据库迁移_Aloudata_InfoQ写作社区