写点什么

阿里巴巴、华为教你如何把数据真正用起来 | DBT How

作者:三少爷的见
  • 2022 年 8 月 28 日
    北京
  • 本文字数:5287 字

    阅读完需:约 17 分钟

阿里巴巴、华为教你如何把数据真正用起来 | DBT How

“以用促建”是数字化转型中数据驱动的一个非常重要的原则,借此得以形成“有数、治数、用数”的数据循环。按《数循环》一书的说法,就是形成数据与业务之间的循序渐进的关系:行动产生数据,数据发现规律,规律帮助决策,决策指导行动,周而复始,不失其行。


但是“以用促建”在实际过程中该如何具体推进呢?很多公司面临的困难依然是有了很多数据,但是实际用起来的很少,就更谈不上通过数据来产生更多的价值了。比如证券行业,本身对信息化比较重视,外规方面也有相应的系统要求,积累了很多数据,但是这些数据潜在的价值并没有发挥出来。造成这些结果的原因还是大家在推进“以用促建”的过程中方法使用不当,本文我就将结合实际的数字化转型实践并借鉴阿里巴巴、华为在锻造其“数据力”方面的经验,来阐述如何有效地推进数据的应用及价值产生。


如何使用数据和数据当前的状况密切相关。根据企业数字化成熟度处于不同的阶段,数据使用的策略也有所不同。当企业刚经历过大规模信息化建设,或者还在信息化建设过程中,这个时候由于缺乏统一的规划,基本上都是不同业务系统各自为政,虽然积累了很多数据,但是数据之间是割裂的,而且数据制造者本身也是对数据的使用有需求的,但是这个微循环(也就是自己产生的一些数据,经过一些步骤加工后,自己都无法很好、很便捷地使用)没有形成。


这个时候一般很多公司都会启动类似于数据平台或者数据中台的建设,核心目标是把已有的数据利用起来。那么如何来进行这方面的建设呢,有没有一些什么好的指导,我借鉴《决战大数据》中“混、通、晒”的提法并结合产品打造(数据平台也应该按照一个产品去建设)的做法总结出了“通、晒、混”的三步法。

一、数据化运营:通、晒、混

1、通:建立数据底座

第一步就是要把割裂的数据进行拉通,建立一个统一的数据底座,进而实现数据的汇聚和联接,打破数据孤岛和垄断,重建数据获取方式和次序。一般包括以下几个步骤:

  1. 统一的定义和架构

  2. 通过数据仓库或者数据湖的建设实现数据的“逻辑汇聚”

  3. 数据主题联接:将数据转换为“信息”


华为数据底座总体架构,来自参考资料 2


数据底座可以实现统一管理结构化、非结构化数据。将数据视为资产,能够追溯数据的产生者、业务源头以及数据的需求方和消费者等。数据底座被华为视为其数字化转型的基石。这个时候数据治理的重要性就必须得到足够重视。

2、晒:推销“产品”,吸引种子用户

在打通了数据之后,接下来就需要确保用户能够更便捷、更合规地获取数据。特别是合规这一点,近期也发生了很多起和数据安全、合规相关的社会事件,说明全社会对于这一点的重视程度越来越高,特别是对于像证券这样的强监管行业,更是要把合规放在非常关键的位置。


这个阶段一般需要做好以下几点:

  • “晒”数据

让全员都能明确无误地了解现在公司都有哪些数据资产,哪些是他们权限范围之内可以访问和使用的,他们可以如何获取这些数据。

  • 做好自助服务

让一线业务人员能够非常高效、便捷、快速地获取到各种所需的数据。

  • 人人都是分析师

除了专业数据人员提供一些服务之外,这个阶段非常关键的一点是需要激活广大的一线业务人员的自主性、参与度和积极性。像证券行业,每家券商都有大量的分析师、投资经理和交易员,他们既有业务知识,又有数据使用的愿望和能力,能否把他们的意愿调动起来,会对最终的数据使用效果起到非常重要的助推作用。


当然,如何更好地调动他们,除了提供类似数据地图、自助服务平台等基础设施之外,还有一个比较好的做法是将数据分析嵌入他们日常的工作流,这样就在潜移默化之中让他们养成用数据、要数据的良好习惯。


《数循环》中就介绍了阿里是如何将数据分析嵌入工作流的:

只有当数据能力泛化到企业的“神经末梢”上时,数据驱动才算起了作用,因为仅让员工拥有好的数据分析工具及意识无异于隔靴搔痒,得想办法把分析工具应用于更接近工作流的决策环节之中。举一个典型的例子,在节日促销期间,当需要为促销页面选择商品或者合适的供应商时,类目主管可以在相关系统及工作流中使用契合场景的分析工具。此举能提高分析的便捷性及价值点,数据能力泛化是落地的必要手段,这是一个数据化分析的普及过程,也是产业数据化的里程碑。

3、混:融合数据与业务,实现“产品”增长

搭建好了数据底座,也有了一些用户在主动使用数据底座上的各项服务,但这还远远不够。我们知道,数据底座的建设及相关数据治理工作是需要耗费大量人力物力的,是有相当投入的,如果只是前述的这些成果还不足以说服公司及相关领导在数据化运营上持续投入。就好比一个好产品一样,有了种子用户的良好反馈后,我们就要开始大规模推广了,带动产品走向规模化扩张之路。


而这就需要数据运营人才,深入了解业务,找出业务和数据可结合的点,赋能具体场景。很多传统行业的 IT 都普遍缺乏运营相关的经验,我觉得这也是这类企业在进行数字化转型中会遇到的一个比较大的挑战,之前我还专门就此话题写了一篇名为“面对数字化转型,金融 ITer 要补的第一堂课:运营”的文章,里面介绍了运营的重要性、运营思维是什么及包括的具体内容,有兴趣的可以详细了解。


很多 IT 人员有一个误区,就是以为“酒香不怕巷子深”,觉得没必要去四处推销且那也不是自己的主要职责,觉得自己只要把平台搭建好了,有需要的自然会来使用,没需求的你花功夫推销了他们也没需求。其实不然,很多时候你以为某条路是通的,但是可能就因为路中间有一个小水坑,而骑车人就选择了绕行其他路。


举一个我看到的会议室预定的例子。你很难想象,在 OA 都推行这么多年的情况下,还有公司在通过一个纸质的笔记本来预定会议室。了解下来发现,这个会议室预定的功能其实 IT 早已实现,而且在总部已经实际用起来了,其他地区想用也就只需配置一下会议室即可。但是问过本地区负责管理会议室(也就是管理那个预定本)的行政人员能不能线上预定,他们说不行。你说这里面有困难吗,肯定有,但是有什么难以解决的大问题吗,也肯定是没有。很多时候就缺乏那么一小点推力,特别是这种跨部门的协调,很多人是没有驱动力或意愿去牵头做这种事情的,所以也就导致大家一直“凑合”着。


总结下来,这一阶段要做什么:

1)通晒混;2)重视数据治理;3)运营思维和数据运营人才的重视和培养。

二、运营数据:用、采、管

我们都知道,收集数据不是目的,让收集起来的数据产生价值才是最终的目标。在第一步数据化运营阶段,我们就开始通过“用数据”来让数据产生价值,但是这里有一个隐含约束,就是在数据化运营阶段,我们更多的是从已有的数据出发,看如何把数据打通,通过共享把数据应用到不同场景中去赋能。我们基本上还是处于一个被动局面,就好比先有了各种原材料,然后厨师在这个基础上再决定能做什么菜。


但这个肯定是不够的。既然数据是一种战略资源,那么企业就不能一直是这种被动的姿态,按照《决战大数据》里的说法,这个时候我们需要过渡到“养数据”阶段。


“用数据”更多的是一种方法论,而“养数据”则是一种数据战略,是基于深入业务理解的更高层次的商业决策。


1、先想清楚业务上要怎么用数据

最大的转变就是要化被动为主动,主动出击去决定要收集哪些数据。既然是主动行为,那么好处就是可以自己选择,但同时也是有成本的。那到底要收集哪些数据?能不能先不管三七二十一,我们先收集数据,将来肯定有用。这种做法太理想化了,数据收集不是一次性行为,收集只是开始,后续还伴随着一系列的数据管理、更新、存储的动作。我想再不差钱的公司也很难可以允许我们这么做。


“不管怎么样,我们先收集数据,将来肯定有用”。我认为,在我职业生涯的这些年,最值得反思的就是这句话。

——《决战大数据》


所以,还是要回归本源。既然数据最终是要产生业务价值,那么我们可以先假定数据都是可获取的,然后思考有了哪些数据后,可以在业务上实现差异化竞争或者颠覆性创新。那么这些数据就是我们要优先去收集的。而这些思考和决定,肯定是要公司领导或业务部门负责人加上 CIO/CDO 来花时间慎重做出的。所以上文才说这是数据战略,而不仅仅是简单的行为,是公司的整体意志,而不仅仅是部门的单打独斗。


当然,这里隐含一个前提,就是此时如果对数据的重视程度还没达到足够程度,基本上也就不可能用战略高度去思考要什么数据,或者即使思考了,也没有相应的保障措施去落地实施。

2、采:主动收集,采行为数据、另类数据

想清楚了要收集哪些数据,那么接下来就是如何收集的问题。收集的策略很重要,如果只是一味地贪全贪多,一是成本很高,二来这种收集行为没有任何差异性,你很难和那些数据巨头或者行业领导者进行竞争。


那么可以从哪些方面寻求突破呢?


首先,可以从那些别人没注意到的数据出发,这个有赖于第一步的思考质量。吴军《智能时代》一书中就举过一个非常有意思的例子:随着美国逐渐采用智能电表取代传统电表,这样不仅能够记录用电量,还能记录用电模式。警察通过一些用电模式的异常来辅助他们查处那些租别墅进行室内毒品种植的嫌疑犯。


其次,可以从另类数据突破。在金融行业,另类数据是一个很热门的话题,举一个有名的 Tesla 的例子(来自参考资料 5,更多关于另类数据的介绍,可以参考资料 4)。


美国时间 2018 年 10 月 25 日,困境中的特斯拉(Tesla)股票录得 9.14% 的大涨,只因为在前一个交易日盘后发布的 2018 Q3 财报大超华尔街预期。财报显示,爆款 Model 3 的产量在过去一个季度较之前几乎翻番,这无疑给了投资人注入了一剂强心针,也引得市场一片狂欢。


面对 Model 3 产量的大增以及 9+% 大涨反映出的市场信心,最高兴的人当属 Tesla 的掌门人 Elon Musk。然而,除了 Musk 之外,同样高兴的另一群人大概要数另类数据公司 Thasos 以及它的很多对冲基金客户们。因为在 Tesla 发布 Q3 财报之前,这群人恐怕早就凭借着信息优势预判到了这一点,并提前在二级市场布局了。


Thasos 是怎么做到的?


他们在一张在线地图上环绕 Tesla 位于 Fremont,California 的占地 370 英亩的工厂,创建了一个数字围栏,以隔离从 Tesla 工厂范围内发出的智能手机位置信号。Thasos 租赁了数不胜数的智能手机 APP 收集到的数万亿个地理坐标的数据库,并通过电脑程序密切监测从 Tesla 工厂中发出的手机信号。使用手机信号量进行估计,他们发现从 2018 年 6 月到 10 月,Tesla 工厂夜间轮班时间增加了 30%。


上图中左侧,横坐标 J、F、M 等为月份的英文首字母缩写。深蓝色曲线为通过手机信号估计出来的夜班(weekday late)工作时间。从图中清晰可见,在 6 月到 10 月之间,夜班工作时间较 Q2 有了大幅增长,意味着产能的提高。Thasos 将这个数据分享给了它的一些对冲基金客户。毫无疑问,这一数据发挥了巨大的作用。


再次,行为数据。当然,另类数据如果方法得当,那么将会是威力巨大,但是很多时候并不是总能想到或做到。除了向外求索这些数据之外,其实企业内部仍然存在很多公司拥有的,但之前没被重视或没有进行收集的数据,特别是一些行为数据。行为数据比结果数据更有价值,而且也是很多第三方数据商所不可能获取得到的。前面在介绍“晒”的时候,我们强调要把数据的使用嵌入到员工的日常工作流中。其实,不但是要据此更好地使用数据,而且也需要注意在这些日常工作流中,实时收集“鲜活”的行为数据。


最后,还有些数据是企业自身没有的,需要用户主动提供的。这个时候我们不可能设计个表格来让用户填写,而是需要开发出一些好的用户端数字产品,让用户在使用我们产品/服务的过程中来愿意提供这些数据。

3、管:专门的数据管理部门和组织已经是必不可缺了

其实金融行业对此应该不陌生,好比每家券商都有一个资金运营或类似的部门,都说数据是新的生产资料,和资本一样,那么我们就应该有专门的组织像运营资金一样去运营数据。


数据管理包括很多方面,比如,数据的来源、如何让数据不丢失、如何保护数据的安全、如何让数据准确和稳定以及如何更好地运用数据。


数据管理,是大数据行业的“脏活”“苦活”“累活”,是最悲催和最难解决的事情。如果没有这些背景作铺垫,我对很多公司在做所谓的大数据的运营就持有怀疑态度了。

——《决战大数据》

4、再回到用,形成循环

采集了数据,也有妥善的管理,那么接下来还是要回到第一步,我们需要用这些鲜活的数据来验证我们最初的假设,看是否可以起到预期的作用,如果不可以,是思路不对,还是采集到的数据质量、维度或频率有问题,需要根据结果来不断地进行调整。乐观的结果是,这些数据能在业务上真正用起来,也达到了预期效果,这样就形成了一个小的正向循环。


总结:

这一阶段主要从问题导向去采集和管理数据,最终为我所用。最缺的人才是:懂数据、见识过数据威力、尝到过数据甜头(这些威力和甜头就有赖于在数据化运营阶段的工作)的业务领头人。


说到循环,其实除了运营数据阶段的小循环之外,“用数据”和“养数据”这两个过程又可以在更大层面形成一个完整的“数循环”,唯有如此,我们才可以说真正把数据用起来了。

完整的“数循环”示意图,来自参考资料 1


参考:

1、《数循环:数字化转型的核心布局》,作者:车品觉

2、《华为数据之道》,华为公司数据管理部 著

3、《决战大数据:大数据的关键思考》,作者:车品觉

4、另类数据资料汇总

5、另类数据的前景和陷阱

发布于: 刚刚阅读数: 9
用户头像

还未添加个人签名 2020.08.26 加入

证券行业数字化转型专家,知乎同名

评论

发布
暂无评论
阿里巴巴、华为教你如何把数据真正用起来 | DBT How_华为_三少爷的见_InfoQ写作社区