写点什么

《可观测性成熟度模型白皮书》正式发布

作者:乘云 DataBuff
  • 2023-09-07
    浙江
  • 本文字数:2160 字

    阅读完需:约 7 分钟

《可观测性成熟度模型白皮书》正式发布

2023 年 9 月 6 日,由中国信通院稳定性保障实验室指导,爱分析、龙蜥社区、国网上海电力信通公司、乘云数字共同参编的,国内首份《可观测性成熟度模型白皮书》正式发布。《白皮书》介绍了可观测性成熟度模型诞生的来龙去脉、设计思路,并系统性地梳理了各个成熟度阶段的能力 t,以帮助组织了解其当前的可观测性水平,并为其提供改进的思路。

关注“DATABUFF”公众号,回复“白皮书”,获取白皮书原文

研究背景

自 2018 年,云原生计算基金会(CloudNativeComputingFoundation,CNCF)正式将可观测性引入 IT 领域以来,可观测性市场迅猛发展,涌现出一大批可观测性解决方案,企业也在寻求不同的方式打造可观测性。然而比较棘手的是,传统的监控厂商与新生的可观测性厂商,均使用了相同的术语与概念,这导致客户对于可观测性的定义变得模糊,甚至很难区分哪些是真正的可观测性方案。同时,企业缺乏衡量和评估软件系统内部可观测性的框架或方法,缺乏反馈可观测性体系建设成熟度水平的框架或方法。

在此背景下,乘云数字联合中国信通院稳定性保障实验室、爱分析、龙蜥社区、国网上海电力信通公司多家单位,基于对生产环境实际问题的丰富处理经验、与不同行业客户的深入交流、对最新技术的持续研究,以及与 Gartner 等机构的对话,共同制作编写了《可观测性成熟度模型白皮书》。希望通过可观测性成熟度模型设计,帮助企业确定在可观测性道路上的位置,并为前进方向提供指引。希望能够为组织提供一种系统性的方法来评估、改进和提升其可观测性体系建设,更有针对性地发展可观测能力、优化资源分配并持续改进。企业通过合理应用该模型,可以更好地应对现代软件系统复杂性带来的挑战,实现更出色的用户体验,提高系统可靠性,并在竞争激烈的市场中取得优势。

内容概览:

《白皮书》历经数月精心编写,旨在为组织、工程师和技术领导者提供一种结构化方法,以评估、提高和优化其软件系统的可观测性水平。本白皮书深入探讨了可观测性成熟度模型的各个方面,重点阐述可观测性成熟度模型的设计思路,各阶段的功能与目标。具体的,白皮书首先介绍了可观测性成熟度的背景,为什么需要可观测性成熟度模型,并基于此,进一步的阐述了可观测性成熟度模型的五个级别内容。这五个级别代表了不同的可观测性水平和能力,从最基本的监控到与业务目标紧密结合的高级可观测性。。

可观测性成熟度模型

本次设计的可观测性成熟度模型,是一种用于衡量和评估企业软件系统内部可观测性的框架或方法,同时也是一种用于反馈企业可观测性体系建设成熟度水平的框架或方法。

该模型设计了五个级别,分别是:

Level 1 :监控(Monitoring)

在这个阶段,我们关注于如何确保系统的各个组件按照预期正常运行。这一阶段的主要目标是实时监测组件的健康状态,出现异常情况时,系统会自动触发警报,通知相关人员。

Level 2 :基础可观测性(Basic Observability)

在这个阶段,我们旨在深入了解系统不正常运行的原因。这一阶段的主要目标是通过采集“三大支柱数据”来洞察系统内部状态,以便明确了解为何系统出现问题。

Level 3 —— 因果可观测性(Causal Observability)

在这个阶段,我们致力于找到问题的根本性原因。以及如何避免类似问题再次发生。在此阶段,我们引入了网络和拓扑数据,以构建更为全面的系统内部理解。

Level 4 —— 主动可观测性(Proactive Observability)

这一阶段,我们的目标是实现自动化的根本性原因分析,自动化的响应与处置,以及智能化的预测与风险阻止。

Level 5 —— 业务可观测性(Business Observability)

在可观测性成熟度模型的最终阶段,我们关注的是从业务角度深入洞察,以确定系统对业务的影响,并从中获取降低成本、增加业务营收、提升转化率等方面的洞察,辅助商业决策。

可观测性成熟度模型的每个级别都必须建立在前一级别已经建立的基础之上,不能凭空构建,每个级别新增的能力,都应该有助于实现更深度的可观测性能力。

级别的提升不是渐进式的,而是明显的跨越式提升(类似量子跃迁)。尽管我们可以通过改进流程、修补问题,在一个级别之内稍微改善结果,但若想实现级别的实质性提升,需要实质性地增强。

参编单位简介

混沌工程实验室

混沌工程实验室,由中国信通院牵头成立于 2021 年,以保障企业云上系统稳定性、提升服务连续性、促进业务高质量发展为目标,构建了针对稳定性建设者、稳定性赋能者以及云服务稳定运行能力的稳定性保障标准体系,为我国系统稳定性保障能力建设起到了重要推动作用。


爱分析

爱分析,是一家专注于数字化市场的研究咨询机构,为企业用户、厂商和投资机构,提供专业、客观、可靠的第三方研究与咨询服务,助力决策者洞察数字化趋势,拥抱数字化机会,引领中国企业数字化转型升级。


龙蜥社区

龙蜥社区(OpenAnolis)成立于 2020 年 9 月,是由阿里云、统信软件等 21 家国内外头部企业联合建立的操作系统开源社区,是国内领先的操作系统开源社区,具备较为领先的产业和技术影响力。


国网上海电力信通公司

国网上海市电力公司信息通信公司成立于 2010 年 1 月 ,主要负责信息通信系统的建设、运维、检修、技术改造、应急抢修和国家电网公司上海数据中心的建设、运行和管理工作。


杭州乘云数字技术有限公司

杭州乘云数字技术有限公司,成立于 2017 年 10 月,国家高新技术企业,是一家专注于云观测、云运维的 IT 公司,拥有多项可观测领域核心发明专利。

用户头像

让云运维更简单 2023-06-25 加入

云观测领导者

评论

发布
暂无评论
《可观测性成熟度模型白皮书》正式发布_乘云 DataBuff_InfoQ写作社区