写点什么

火山引擎 DataLeap:如何构建一套完整、易用的数据标准体系

  • 2023-05-31
    北京
  • 本文字数:893 字

    阅读完需:约 3 分钟

火山引擎DataLeap:如何构建一套完整、易用的数据标准体系

数据标准是数据治理体系中的核心要素之一。


一方面,统一的数据标准可以在复杂的业务场景下,帮助团队对齐数据口径,提升数据在分析、诊断等场景的质量与效率;另一方面,数仓团队与分析师团队也需要沉淀一套敏捷、可控的数据标准指标管理流程,以便后续在指标口径的增加、修改、下线等方向更标准、高效。


但数据标准建设并不是一个简单的过程。在同一个企业内部,也存在对标准认知不一致的问题。以银行业举例,对于“客户”的定义,客户部认为“办了银行的卡的人即为客户”,而网银部则认为“银行网站注册过、或者通过银行转账的人都属于客户”,这即是对同一个概念存在认知偏差。


另外,在实际数据开发过程中,也存在开发人员对同一个字段采用不同的命名,或者存在同义不同名的元数据字段,导致沟通成本增加,甚至最终影响数据质量。


近期,火山引擎大数据治理研发套件 DataLeap 上线的「数据标准」模块瞄准这一问题,希望为数据从业提供一套数据标准的管理能力。


据介绍,该模块已提供数据标准、标准代码、命名词典管理的功能,还支持对各类数据源的库表进行扫描,并进行智能推荐对标。对于企业整体的数据标准情况,DataLeap 则提供可视化的统计大盘,帮助数据团队快速了解标准的新建情况和使用情况。

火山引擎 DataLeap 数据标准产品页面


用户仅仅只需要操作 3 个关键步骤,即可完成数据标准统一:

  1. 标准建立:通过在标准域管理预先定义好字段类型配置,实现版本资产映射管理,支持批量导入,实现数据标准代码统一、命名词典批量导出。

  2. 标准管理: 查看版本历史,帮助用户订阅标准并查看变更日志记录。

  3. 标准映射:可将数据标准与多种数据源字段建议映射,可查看数据标准评估结果,或根据映射通过情况纠正。


在使用场景上,用户基于 DataLeap 完成统一数据标准建设,消除数据不一致性,推动数仓规范数据建设,还可以与指标服务打通,对接数据地图资产,进一步达到数据治理的目的。


除了数据标准管理之外,火山引擎 DataLeap 还提供数据集成、开发、运维、治理、资产、安全等能力,帮助用户提升数据研发效率、降低管理成本,加速推动企业的数字化转型,目前已经应用于泛互联网、制造、新零售、汽车等领域。


立即跳转火山引擎DataLeap官网了解更多

用户头像

小助手微信号:Bytedance-data 2021-12-29 加入

字节跳动数据平台团队,赋能字节跳动各业务线,对内支持字节绝大多数业务线,对外发布了火山引擎品牌下的数据智能产品,服务行业企业客户。关注微信公众号:字节跳动数据平台(ID:byte-dataplatform)了解更多

评论

发布
暂无评论
火山引擎DataLeap:如何构建一套完整、易用的数据标准体系_大数据_字节跳动数据平台_InfoQ写作社区