在 DataOps 体系建设中,主动元数据是何角色?
首先,主动元数据是相对静态元数据而言,它是一种动态、智能化的元数据管理技术,能够将传统静态元数据的被动等待变为实时在线、主动触发,推动数据探查、开发、测试、部署、运维和监控等数据治理工作高效运转,为数据的治理开发决策提供智能化支持。
Gartner 将主动元数据定义为“是对所有可用的用户、数据管理、系统/基础设施和数据治理实践报告的持续分析,以确定数据设计与实际情况是否对齐或出现异常情况”。
在 Aloudata 看来,主动元数据强调更深度更持续的数据理解,不只理解数据的 Schema、产出时间等基础信息,更多是要理解数据背后的加工口径、业务主体、汇总粒度及如何正确使用等;强调更主动的元数据服务,不再在遇到数据使用及管理问题时,被动等待用户去数据目录检索信息,而是主动提供设计建议,抑或是可被系统执行的指令;强调与数据工具主动集成,贯穿数据生产、消费和协作的各个环节,为用户提供智能化建议,以实施更主动的数据治理策略。
其次,提到 DataOps,从 2018 年 Gartner 将 DataOps 纳入到数据管理技术成熟度曲线中,便标志着 DataOps 正式被业界所接纳并推广起来。Gartner 认为,DataOps 是“一种协作式数据管理实践,专注于改善整个组织内数据管理者和数据使用者之间数据流的沟通、集成和自动化”,其目标是“通过对数据、数据模型和相关工序创建可预测的交付和变更管理,更快地交付价值。”
异曲同工,在 2024 年中国信通院发布 2.0 版本的《DataOps 实践指南》中,将 DataOps 定义为“数据研发运营 体化”,是一种数据开发的新范式,将敏捷、精益等理念融入数据开发过程,通过对数据相关人员、工具和流程的重新组织,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据产品交付效率与质量,实现高质量数字化发展。
从上述定义中,不难发现,无论是 Gartner 还是信通院,都认为 DataOps 的价值主张在于通过“端到端打通数据流水线,打破“点对点”的低效数据协作流程,实现“手递手”的数据价值释放。
具体来看的话,DataOps 体系建设要解决的是当下企业数据开发和消费中广泛存在的“数据协同难、数据管理难、数据交付难”的挑战,更多的是站在数据交付的视角,思考如何赋能 ETL 工程师、数据架构师、数据管理员和相关上下游角色,快速高效完成工作,提升整体数据交付效率和交付质量。DataOps 体系不仅需要考虑现有各个数据开发、运维和管理平台如何实现一站式、一体化建设,还需要找到通往自动化、智能化的方向发展路径,保障整个数据平台的高可用性和连续性,最终达到“效率”和“管理”的兼顾与平衡。
再深一层看,要落地 DataOps 体系,需要构建“工作流、数据流和控制流”三层架构。工作流涵盖数据探查、开发、测试、部署、运维和监控等各个活动,数据流涵盖数据从入湖仓、加工、流转到出湖仓进入各个应用场景的完整链路,控制流作为 DataOps 体系的感知决策中心,驱动工作流、数据流敏捷流转和持续迭代。
构建 DataOps 控制流,需要实时采集、解析和分析 DataOps 体系中各项元数据信息,因此需要元数据从“被动”切换为“主动”,主动元数据便成为企业构建 DataOps 体系的新支点,而主动元数据平台是企业建设 DataOps 体系的基础能力和必备平台。
针对于此,Aloudata 推出的自主研发的主动元数据平台——Aloudata BIG,具有全球独创的算子级血缘解析技术,能够自动构建精细、准确、全面、实时的数据血缘图谱,彻底改变过往元数据不准确、不连通、不精细、不保鲜的顽疾,“让元数据能用起来”,可作为企业内统一的元数据中心和 DataOps 体系的控制中心,驱动企业 DataOps 体系实现主动数据管理和敏捷数据协同。
极致精准:独创算子级血缘技术,实现数据血缘解析准确率 99% 以上,看清一切细节
全域联通:自动采集解析包括库、表、列、报表、模型、标签、脚本等一切元数据信息,形成相互关联的元数据图谱,让数据处理和流转的每一个环节都能被精准追溯和刻画
行级裁剪:常用公共表或指标表等 Hub 表会导致血缘繁华,行级裁剪可依据上下游的表列元数据信息动态精准过滤无关血缘
主动智能:强大的元数据策略服务引擎,实时捕获各类事件,系统主动分析预警,让“人盯人”变为“事盯人”
统一服务:丰富的元数据采集器和反向元数据 API,实现 DataOps 体系元数据的“一次采集,处处服务”
在高度复杂的数据开发和消费环境中,Aloudata BIG 已帮助招商银行逐步推进 DataOps 体系建设不仅将现有血缘图谱升级为算子级血缘图谱,实现 99% 的血缘解析准确率,更实现了元数据应用智能化、链路保障自动化和架构治理长效化,推动数仓快速实现资产数量下降 40%、平均链路缩短 50%。如您对主动元数据和 DataOps 体系建设感兴趣,欢迎访问 Aloudata 官网,了解更多。
评论