没有可观测性,DataOps 注定失败|TheNewStack
【 文章来源 】https://thenewstack.io/without-observability-dataops-is-doomed-2/
企业的健康取决于其数据。组织不仅依靠数据来加速和适应,而且越来越多地依靠数据来执行最基本的业务运营:从招聘新员工到发布和移动产品。
就像软件开发中的 DevOps 一样——作为这个新功能的模型——DataOps 充当不同技术数据功能之间的桥梁,包括工程、运营和分析师,甚至非技术业务用户。DataOps 的目的是获得数据环境的基线图,并为整个组织的数据使用建立最佳实践。它融合了对维护健康数据至关重要的协议、人员和技术。
如果没有 DataOps,几乎不可能以业务需要的所有方式保持数据流动。然而,如果没有数据可观测性,DataOps 就会盲目运行。
数据格局是碎片化和疯狂的
在几年前,数据生命周期还是由 IT 集中管理。如果出现问题,建造管道的工程师可以发现并纠正它,但景观已经变得支离破碎。
每年都有越来越多的供应商,越来越多的工具,越来越多的管道。如今,一般公司会利用 400 多个数据源。
同时,数据本身也越来越货币化:企业依靠实时数据来编排供应链,而消费品牌的生死取决于推荐算法的准确性和相关性。
我们不再生活在一个团队可以每周数次查看报告或仪表板的世界中,并有数小时甚至数天的时间来解决数据问题。
什么是数据可观测性?
大多数人喜欢将数据可观测性视为了解数据状态的窗口。但数据可观测性不是静态的或被动的——它是一个主动的过程。数据可观测性的核心包括四个关键组成部分:
数据质量。您能否确认所依赖的数据是最新的、准确的且格式正确?
数据沿袭。你相信你的数据来源吗?您是否了解它是如何在系统中移动的以及在何时何地被使用?
数据监控。每条管道是否 24/7 全天候运行?管道是否传输了您需要的所有数据,而不仅仅是 90%?
通知。当出现问题时,您的数据会立即告诉您,还是等到查看报告或运行诊断时才告诉您——此时是否已经为时已晚?当您确实收到通知时,它是否完整且相关,足以为您指出正确的解决方案?
“可观测性”意味着 DataOps 可以观测数据基础设施、数据流和数据本身。然后,当出现问题时,自动警报会通知 DataOps 或数据工程师,以便他们解决问题——或者至少暂停信任这些不可信数据的人员和程序。
将数据可观测性带入生活
您如何确保组织具有数据可观测性?与数据中的所有内容一样,没有简单的、一刀切的解决方案。
对于拥有现代模块化数据技术堆栈的小型组织和初创公司,答案可能是添加专门构建的数据可观测性解决方案。在过去的三到四年里,出现了几家软件初创公司,它们明确地将自己定位为数据可观测性工具,而一些稍旧的数据目录解决方案提供数据可观测性功能。
但对于拥有更成熟数据技术堆栈的大型公司而言,解决方案可能已经掌握在您手中。如果您的综合数据平台提供数据清单和控制台管理功能,可以通过优先考虑上述组件来实施数据可观测性计划。
那么,数据可观测性只是另一个趋势吗?一句话,不。没有数据可观测性的世界是这样一个世界,当您发现数据错误时,已经为时已晚。这是 DataOps 领导并改善整个业务数据的健康和价值的机会。
评论