“数据资产”究竟是“数据”还是“资产”
说“数据”,大家都能理解,因为能看得到数据库里面存的一个具体的数字和内容;
说“资产”,大家也能理解,因为能够变成钱的估值,最终呈现为银行卡上的数字;
但说到“数据资产”,就不那么容易理解,你可能会有很多的疑问:
“只要拥有数据就可以成为数据资产吗?”
“需要是海量的大数据才可以被称为数据资产吗?”
“既然称为数据资产,就一定是可以被量化和估值的吧?”
数据资源和数据资产还是有较大区别的,从数据资源到数据资产,中间还有很长的数据治理的路要走,但看完这篇总结,应该能对数据资产的概念有一个整体的认识,能得到上述问题的答案,也能找到从数据资源到数据资产的规划路径。
数据资产化是数据应用成熟度的体现
数据资产的概念,不能从字面来理解,它是企业对数据应用成熟度的体现,数据处理和应用足够成熟,才可以将拥有的数据资源,转变为数据资产。
数据资产最适合用来类比的概念,既不是数据,也不是资产,但可以参照“品牌资产”的概念来更好得理解它。
品牌资产是20世纪80年代出现的重要概念,并成为此后十年营销领域的研究热点。品牌资产是无形的,但会因市场而变化,因消费者的品牌经验而变化,同时会影响消费者的购买行为及品牌反应。品牌资产主要包括品牌的认知度、美誉度、忠诚度等方面,通过多种方式向消费者及企业传递价值。
每一件产品都有一个品牌,就像每一家企业总会在生产活动中产生数据,但品牌之所以能称之为品牌资产,是因为它广泛地被大众所认知,在产业和消费者心中具备一定的声量、调性和影响,于是就变成了一种很有价值的产物。
数据要成为数据资产,要经历得过程也是类似的。数据产生之后,经过高质量的采集、汇聚和加工,能够广泛地应用到生产活动中去,连接的场景越来越多,发挥的作用越来越大,它也就可以被称之为数据资产。所以,数据资产和品牌资产的概念类似,企业在营销方面的成熟度足够高,才可以被称为品牌资产,数据资产也是企业数据应用成熟度提升之后的产物。
数据资产化的三个特征
将企业的数据资源转变为数据资产的过程,就是数据的应用和管理逐步成熟的过程。完成数据资产化的转变,有三个主要的特征。
1. 数据集中管控
数据如果仅仅作为资源,往往是缺少统筹管控的,数据标准、数据开发规范、数据安全和质量等方面往往很难得到保证。不同的数据消费方专注于自身环节的数据需求,自成标准,容易导致数据的烟囱式建设,口径标准不统一等问题,也没有人能够清晰得说出来企业拥有的数据全景和价值链路。
不论是数据的平台工具,还是数据的公共服务,在完整的数据应用链条上,都需要有明确的权责归属,对数据的标准、安全和质量负责。但说到数据,从来不只是技术问题,因为数据有很强的业务属性,与组织、管理、信息安全等方面息息相关,会涉及很多业务规则的定义、上下游系统的联动,所以不能靠一个团队或部门,解决所有的管控问题,但需要有这样的团队,基于数据管理的思路,协同其他的角色,共同建立全面的数据管控机制。
2. 数据有序流动
我们说,数据资产化运营,需要有人能从全局的角度,对数据相关的问题进行统筹和管控,主要是为了加强数据的质量、标准、安全和规范性,但不是“数据垄断”,不意味着所有的数据应用只能由一个数据团队支撑。相反,数据要在集中管控的过程中,得到有序的流动,因为数据价值是建立在数据充分流动的基础上的。
当数据只是资源,还不能称之为资产的时候,没有集中管控,数据也可以流动,但往往是无序的:
明细层的数据被多个下游消费方接走,在此基础上进行重复的二次加工、清洗、建模、应用,带来的是数据二义性,以及重复开发和资源浪费。
某一个业务单元产生的数据,只在自己业务单元内部共享,形成局部闭环,以此来打造自己的业务创新应用和竞争壁垒,不允许其他体系消费,于是便形成了数据孤岛。
所以,数据是否得到有序的流动,也是数据资产化的重要特征之一。
可以回想一下,自己的企业中,是否存在数据孤岛或者链路断层:需要的数据无法获取或者不知道通过何种方式或者流程可以获取。是否存在安全隐患:内外部的数据流动,缺乏有效的流程和工具保障,由于信息不透明,有时候会存在数据被重复购买,或者在数据所有者不知情的情况下,被提供给了外部,带来了安全隐患,或是商业风险。
3. 数据价值得到追溯和评估
数据价值的追踪和评估,是数据资产化必须具备的另外一个重要特征。
我们强调数据要有序流动,很多人会想要知道,是否有一种方式,能以按照条数或者字段数等方式对数据价值进行量化,以此来进行数据变现。
可以很明确的说,这种数据变现的思路是不可取的。
数据本身的价值是很难量化的,数据要连接到场景中才会发挥价值,所以同一份数据对于不同的消费者的意义和价值是完全不一样的。抽样数据和全量数据的价值,也是完全不一样的,数据完整度高,数据的价值也将会更大,但并不能根据数据量来线性计算。行业里确实有很多进行数据交易类业务的公司,但那些大部分是对数据资源的交换或者售卖,而且定价并没有统一的标准和规范,没有太大的参考意义。
在这里想要重点探讨的,主要是站在企业第一方数据的视角,如何对数据价值进行更好的评估。数据的价值需要在分析中提炼出来,在应用中连接出来,在治理中节省出来。
在这个视角下,数据价值的追溯和评估,包含两个方面,一个是成本方面,一个是价值方面。
不能不计成本的进行数据应用,否则随着体量的增长,必然会陷入数据成本的泥潭。数据的成本,可以从数据任务消耗的存储资源和计算资源两个方面进行评估,保存这份数据所需要的磁盘空间大小、计算时占用的CPU核数及内存大小,都可以作为数据成本的量化指标来进行参考。
价值端,比成本要复杂得多,很难有一个直接的方式来进行量化,但可以从侧面进行评估:比如数据的活跃度(更新频率、扫描及调用次数)、连接度(通过数据血缘找到下游依赖的数量)和贡献度(下游数据应用端的重要程度和等级)等,综合各个维度的信息来形成一个价值评估模型。而要完成价值端的评估,首先要建立企业数据地图和数据血缘,能够追溯到数据的下游依赖和应用出口。
有了成本和价值两个视角的评估,进而可以将数据进行分类分级,并有重点得开展数据治理,降本增效。比如针对价值低、成本高的数据,可以推动下线或优化。所以说数据价值的追溯和评估,是数据应用成熟度的重要标志,也是资产化的必要特征之一。
版权声明: 本文为 InfoQ 作者【马踏飞机747】的原创文章。
原文链接:【http://xie.infoq.cn/article/251c9248caf19695a300ed94b】。文章转载请联系作者。
评论