为何数据类大项目都会先做盘点??
最近跟几个做数据的大牛沟通,本来想了解一下数据工作如何开展,得到的答案有一点是出奇的一致,那就是做项目之前要有一个顶层设计,先有一个大的规划,放大一点的公司的话,会先有一个咨询项目。其次,数据盘点也是经常被提及的,这是我没有想到的,因为数据仓库是根据需求来的,很少会对全域数据做一个盘点,因为除了工作量较大不出,最后挖掘出来的需求也可能是有限或者说有落地风险的?因为站在数仓的角度,我虽然懂数据,懂数据产生的业务流程,但是我不敢说比业务还懂业务。所以对于数据的使用场景,一般会有业务方发起,数仓开发人员进行对接输出接口,但是随着大数据,AI 的兴起,可能算法会比业务人员更懂业务。
俗话说:没有调查,就没有发言权。所以如果能让数据比业务更懂业务呢?这时候就引入了数据资产盘点,只有知道企业内部有什么数据,有哪些数据需求,再对标同类型企业的做法,有没有借鉴的地方,会提出更好的优化方向,这也是最近几年数据湖兴起的原因。因为数据已经是资产了,不过现有价值的高低,先盘点完接过来,再进行后续操作,这才为后续的数据建模,算法等等提供了“弹药”。
知己知彼,百战百胜,只有理清企业内部的数据来源,数据产生的场景,数据的需求以及业务人员的痛点,才知道数据如果使用才能有效发挥其价值,从而让数据成为资产。
版权声明: 本文为 InfoQ 作者【奔向架构师】的原创文章。
原文链接:【http://xie.infoq.cn/article/e848449db0fe25c4a51d4e73f】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论