《华为数据之道》读书笔记:第 7 章 打造“数字孪生”的数据全量感知能力
数字化转型是在解决工业革命时代没有解决的效率和成本问题,所以如果转型依赖的数据,还是需要组织大量专业人员去录入、去校验,那么就并没有从源头上解决数字化转型要解决的效率和成本问题。数字化转型要从根本上加强数据的可获得性,围绕我们构建的数据主题和对象丰富数据感知渠道。要追求更加实时、全面、有效、安全的数据获取。
1 “全量、无接触”的数据感知能力框架
1.1 数据感知能力的需求起源:数字孪生
2003 年,Michael Grieves 教授首次提出了“与物理产品等价的虚拟数字化表达”的概念,并给出了定义:一个或一组特定装置的数字复制品,能够抽象表达真实装置并可以此为基础进行真实条件或模拟条件下的测试。数字孪生(Digital Twin,DT)即由此概念衍生而出并沿用至今。
基于数字孪生衍生出来的企业数字孪生(Digital Twin of an Organization,DTO)是一种动态的软件模型。模型需要输入组织的运营及其他类型的相关数据,以实现组织运营模型在虚拟世界中的映射,并能更新实时状态、应对外界变化、部署相应资源和产生预期客户价值。
很多非数字原生企业的数据管理能力不足、信息化程度较低,企业数字孪生还遥不可及,但这又是数字化转型的趋势,所以可以先着手构建数据采集能力,完成数据感知、接入和存储,先让企业具备企业数字孪生的基础。
1.2 数据感知能力框架
企业需要构建数据感知能力,采用现代化手段采集和获取数据,减少人工录入。
数据感知可分为“硬感知”和“软感知”,面向不同场景。“硬感知”主要利用设备或装置进行数据的收集,收集对象为物理世界中的物理实体,或者是以物理实体为载体的信息、事件、流程等。而“软感知”使用软件或者各种技术进行数据收集,收集的对象存在于数字世界,通常不依赖物理设备进行收集。
感知产生的数据还是孤立的物理对象的镜像,需要在企业这一复杂对象内部与其他数据资产一起,与流程、运营和指标之间建立关系,纳入企业的信息架构进行管理,才能真正打通从数据感知、生成到消费的链路。
最终的目的是生成企业级的感知数据,形成数字孪生的基础,满足企业利用人工智能、机器学习对数字孪生对象进行仿真分析、控制并优化制定战略目标的需求,帮助企业动态把握组织所处的环境,帮助管理者实时了解企业运营情况,为企业数字化变革提供建议,通过这些数字化的手段持续变革创新、获取业务价值。
2 基于物理世界的“硬感知”能力
基于物理世界的“硬感知”依靠的就是数据采集,是将物理对象镜像到数字世界中的主要通道,是构建数据感知的关键,是实现人工智能的基础。
硬感知数据的可以分为 9 类:条形码与二维码、磁卡、RFID、OCR 和 ICR、图像数据采集、音频数据采集、视频数据采集、传感器数据采集、工业设备数据采集。
3 基于数字世界的“软感知”能力
已经存在于数字世界中的那些分散、异构信息,可通过“软感知”能力来利用。
“软感知”分为三类:
埋点:埋点是数据采集领域,尤其是用户行为数据采集领域的术语,指的是针对特定用户行为或事件进行捕获的相关技术。
日志数据采集:日志数据收集是实时收集服务器、应用程序、网络设备等生成的日志记录,此过程的目的是识别运行错误、配置错误、入侵尝试、策略违反或安全问题。
网络爬虫:又称为网页蜘蛛、网络机器人,是按照一定的规则自动抓取网页信息的程序或者脚本。
4 通过感知能力推进企业业务数字化
4.1 感知数据在华为信息架构中的位置
在企业中,只有将感知数据纳入整体的数据体系中,才能发挥感知数据的价值。华为数据治理下的感知能力对接了数据供应链,数据从感知采集到最终的分析消费,都纳入公司级的信息架构,作为数据资产来进行管理。
感知数据生成后,需要通过连接进入下一步环境,通过不同的数据类型,选择不同的数据接入方式。在确定数据接入方式之前,需要重点考虑以下几个问题。
数据源的可用性分析。
接入的数据量大小。
数据接入过程是连续的还是按一定的时间间隔进行。
数据接入是拉(Pull)的方式还是推(Push)的方式。
在数据接入的过程中,是否需要做数据校验或数据标准化。
在接入的过程中,是否需要对数据做进一步的处理,如数据聚合、数据分类等。
作为数据资产管理的核心,感知元数据管理应该包含两个方面的内容:
感知方式元数据:对数据感知的方法进行登记注册的过程,在后续的数据消费的过程中可以知道数据来源。
感知内容元数据:感知内容包括结构化数据和非结构化数据,所以元数据管理也分为结构化数据元数据和非结构化数据元数据。
4.2 非数字原生企业数据感知能力的建设
非数字原生企业需要构建感知能力,可以考虑从以下几个方向来选择,关键是能力的构建始终要贴合业务,尽快促成业务价值的呈现。
开发一个独特的物理对象感知能力可以获得收益的方向,包括改善运营、降低运营风险、降低成本、更好地为客户服务的机会,或者通过拥有质量更高、更全面的数据来进行更好的业务决策。
在更复杂、更昂贵的环境中,更有可能抵消感知能力构建的实现成本。
组织是否拥有相关感知能力的前身,比如可以利用现有的、详细的元数据和模型(例如 BOM、CAD 和仿真模型)。
需要一个模型来支持极端的操作环境,比如远程或环境恶劣的地方。
探索技术或商业模式的创新,比如增强现实的应用,或者实现资产货币化的新方法,或者提供前所未有的、差异化的服务水平等领域。
评论