写点什么

当我们在谈‘数据标准’的时候,我们到底在谈什么?

作者:圣迪
  • 2021 年 12 月 07 日
  • 本文字数:2563 字

    阅读完需:约 8 分钟

缘起

今天的 28 天挑战赛起了这么长的一个名字,原因在于:

  1. 早上看老彭友的公众号发的一篇文章《相比 DCMM,DMBOK 为什么没有数据标准?》里面对 DCMM 内容以及 DMBOK 内容中关于数据标准这块的差异,有了一些自己的见解。

  2. 下午了解到一些的汇报的内容中,也在提及‘数据标准’这个名词。

那么,问题来了,短短的四个字,我们在谈到‘数据标准’的时候,到底在说什么?

DMBOK

首先,让我们马上打开 DMBOK。DMBOK 全称 《DAMA 数据管理知识体系指南》,目前我用的是第 2 版。在 DMBOK 的目录中,我们的确和老彭的文章说的那样,并没有找到专门讲解‘数据标准’的这一个章节。但我在第 3 章数据治理的 3.2.3 节 实施数据治理的第一小节,找到了以下的内容:

“1.发起数据标准和规程

标准被定义为‘用来判断其他事物质量的好东西’或‘由权威建立和确定,作为衡量数量、重量、范围、价值或质量的规则’(http://bit.ly/2sTfugh)。因为标准提供了一种比较方法,所以其有助于质量的定义。标准还提供了简化流程的潜力。通过采用标准,组织只需做一次决定,并将其编成一组实施细则(准则),而不再需要为每个项目重新做出相同的决定。实施标准应促进使用标准的过程产生一致的结果。”

从以上的文字,我们是否能概括一下:标准,是一种由权威建立的,具备简化流程、产生一致性结果潜力的实施细则。那么,什么由是数据标准?接下来的文字是这样描述的:

“数据标准可以采用不同的形式,具体取决于所描述的内容:关于如何填充字段的要求、控制字段之间关系的规则、可接受和不可接受值的详细文档、格式等。······应记住,通过记录数据标准提供了一个扑获细节和知识的机会,否则可能会丢失这些细节和知识。·····”

从这一章或者这一节,并没有给出,什么是数据标准的明确定义,甚至整本 DMBOK 也没有(我没找到,看官您看到了可以告诉我一下),而仅仅只是告知了读者,对于数据标准可以怎样做。

OK,既然 DMBOK 没有,那么我们找找 DCMM 吧。

DCMM

DCMM 全称《数据管理能力成熟度评估模型》,是国家标准 GB/T 36073-2018。在 DCMM 中的一开篇第 3 节 术语与定义中的 3.7,便对数据标准(data standard)有了明确的定义:

“数据标准 data standard:数据的命名、定义、结构和取值的规则。”

而在 5 综述的能力域中,也对数据标准的能力项,有了比较清晰的定义:

  1. 业务术语

  2. 参考数据和主数据

  3. 数据元

  4. 指标数据

于是,立刻翻到‘数据标准’这一节,再来细细品之。

首先上来的是第一小节,‘业务术语’。

“业务术语是组织中业务概念的描述,包括中文名称、英文名称、术语定义等内容。业务数据管理就是制定统一的管理制度和流程,并对业务术语的创建、维护和发布进行统一的管理,进而推动业务术语的共享和组织内容的应用。业务术语是组织内容理解数据、应用数据的基础。通过对业务术语的管理能保证组织内部对具体技术名词理解的一致性”。

我们看到,这里其实说的就是,描述的口径要一致。

那么, 再来看第二小节,‘参考数据和主数据’。

“参考数据是用于将其他数据进行分类的数据。参考数据管理是对定义的数据值域进行管理,包括标准化术语、代码值和其他唯一标识符,每个取值的业务定义,数据值域列表内容和跨不同列表之间的业务关系的控制,并对相关参考数据的一致、共享使用。

主数据是组织中需要跨系统、跨部门共享的核心业务实体数据。主数据管理是对主数据标准和内容进行管理,实现主数据跨系统的一致、共享使用。”

这里的解释,个人觉得是非常抽象的,因此可以再参考一下 DMBOK 对于这二者的解释:

“参考数据是指可用于描述或分类其他数据,或者将数据与组织外部的信息联系起来的任何数据。”举例来说,国家的省市自治区的编码,花、草、鱼虫的分类等,都可以称为参考数据。

“主数据是有关业务实体(如雇员、客户、产品、金融结构、资产和位置等)的数据,这些实体为业务交易和分析提供了语境信息。实体被实体、实例以数据/记录的方式表示。”这里,我们可以理解为,主数据是底层的,为对应的业务发生提供基础的实体的数据。如常用的主数据会有组织主数据、人员主数据、科目主数据,在制造业企业中物料主数据也是重要的一环,等等。

在这一节里,我们看到,参考数据和主数据的管理,都是在描绘发生数据的基础数据。即基础要一致且共享,上层业务数据才能一致。

第三小节,‘数据元’。

“通过对组织中核心数据元的标准,使数据的拥有者和使用者对数据有一致的理解。”

这个名字乍一看,有一些不知其所言的困惑感,所以带着问题继续看到‘12.3.3 过程目标’:

“过程目标如下:

a) 建立统一的数据元管理规范;

b) 建立统一的数据元目录。”

所以,这里讲的,其实就是所有的数据,需要有统一的管理规范和统一的管理目录,进行编码索引,使得同一个组织内容的所有人,得到的数据都是相同的,并保证大家的数据理解都达成了一致。

最后,第四小节,‘指标数据’。

“指标数据是组织在经营分析过程中横梁某一个目标或事物的数据,一般由指标名称、时间和数值等组成。指标数据管理是指组织对内部经营分析所需要的指标数据进行统一规范化定义、采集和应用,用于提升统计分析的数据质量。”

因此,最后一节,描述的就是指标的定义也需要进行统一和规范,这样才能使得组织内的每个人,得到的指标数据定义和值都是一致的。

总结

以上,我们简单地将两份权威的‘标准’拿了出来,和大家一起来看看, 什么是‘数据标准’?事实上, 在我看来,‘数据标准’就讲了两个字:统一。如果硬要多说一点,那就还有两个字:一致。

那么问题来了, 你说‘统一’就‘统一’吗?凭什么听你的呢?DMBOK 里有言:由权威设立。所以,更多时候,标准会由具备权威的人或者组织来进行设定,具备一定的强制性。那么,我是否能够自己确定这个标准,其他人来遵循呢?所谓三流的公司做产品、二流的公司做品牌、一流的公司做标准,你做得牛当然能够确立你的行业数据标准。DCMM 里,对数据管理成熟度做了分级,当企业达到了最高级——优化级时,其标准便是

“1. 参加行业、国家业务术语标准的制定;

2. 业界分享最佳实践,成为行业标杆”。

所以,成为业界标准当然可能。不过,任重道远。不过心所向之,行必往之,指日可待。


所以,当我们讨论‘数据标准’的时候,我们到底在讨论什么呢?


于辛丑年大雪

发布于: 刚刚阅读数: 2
用户头像

圣迪

关注

还未添加个人签名 2019.04.09 加入

还未添加个人简介

评论

发布
暂无评论
当我们在谈‘数据标准’的时候,我们到底在谈什么?