越来越多地使用 SLO 来实现可观测性|DevOps
【 文章来源 】https://devops.com/increasing-use-of-slos-to-enable-observability/
在大多数 IT 和运营部门中,可观测性是一门不断发展的学科。为了更快地发布稳定的软件,运营商需要持续了解性能、正常运行时间和可用性等指标。因此,工程师正在全面增加对服务水平目标(SLO) 的使用——最近的一项研究发现,82% 的公司正在增加对 SLO 的使用。
SLO 可以深入了解特定应用程序的性能,站点可靠性工程师(SRE)经常使用它来确保质量并避免服务中断。不仅如此,各个团队还在将 SLO 与业务的各个方面关联起来,以降低成本并帮助指导决策。尽管许多环境具有可见性,但仍然存在差距。
Nobl9 最近发布了一项针对 IT 专业人士和高管的全球调查,该调查跟踪了 2022 年的服务水平目标状态。我们将查看报告中的主要发现,并考虑它们对 SLO 状态和总体可观测性的意义.
可观测性和 SRE 状态
总的来说,站点可靠性工程在各个组织中仍然日趋成熟。尽管只有 31% 的公司采用了 SRE,但它预计未来会有很大的增长,因为 46% 的公司表示他们计划在未来采用 SRE。
这些运营商现在面临着许多云原生可观测性工具,这些工具正在以指标、日志和链路的形式生成海量数据。39% 的公司使用 6 到 10 种可观测性和监控工具,35% 的公司使用超过 11 种。
现在部署了这么多工具,谁在使用这种可观测性和监控数据?在 74% 的公司中,可观测性数据支持运营需求。运营团队最有可能使用 SLO 来监控正常运行时间、性能和整体效率。在运营团队之后,安全团队也使用这种可观测性数据 (71%),这是有道理的,因为 SLO 可以通知事件响应。接下来的其他领域是客户支持、合规性和容量规划。
一项有趣的发现是,只有 42% 的公司使用 SLO 来遵守服务水平协议 (SLA)。这表明 SLO 最常用于内部优化和决策。
混合环境使可见性复杂化
公司大多跟踪 SLO 以提高其对网络 (83%)、数据库 (76%) 和应用程序 (75%) 的可见性。其他主要领域包括私有云环境和传统计算安排。但是,尽管可观测性是趋势,但组织仍然缺乏对整个堆栈的完全可见性。
值得注意的是,近一半 (46%) 的受访者表示,他们的监控和可观测性工具无法提供对其公司所有 IT 资产的全面可见性。例如,只有 45% 的公司可以看到他们的容器,只有 35% 的公司可以看到他们的微服务架构。
由于混合云和多云条件的增加,缺乏全栈可见性可能会变得复杂,因为 78% 的人表示混合云环境使监控基础设施更加困难。
跟踪 SLO 的好处
该报告将 SLO 定义为“随着时间的推移为给定系统、应用程序 或 服务设置的性能和可用性目标”。对于遵循此类目标的组织而言,好处显而易见——它们可以帮助提高绩效、直接决策并帮助避免停机。
因此,70% 的公司目前以某种方式使用 SLO。以下是跟踪 SLO 的一些好处:
提高微服务性能:87% 的人表示在微服务架构中使用 SLO 可以提高服务性能。
启用全栈可观测性:58% 的人表示他们公司的一些 SLO 已映射到业务运营。
改进业务决策:91% 的人同意使用 SLO 有助于推动更好的业务决策。
防止服务中断:67% 的人表示,他们的公司通过 SLO 阈值警报防止了业务中断。
减少开支:90% 的人表示 SLO 为他们的公司节省了资金。
最后的想法
更多的团队正在跟踪服务水平目标。大多数未使用 SLO 的公司 (71%) 现在计划尽快采用它们。数据表明,可观测性市场是一个不断发展的领域,具有增长空间。关于 SRE 角色也可以这样说。
并非所有公司都会采用完全相同的角色或监控程序,谁在使用 SLO 以及如何应用它们可能会继续存在差异。无论如何,该研究表明,调查 SLO 有可能在许多方面使软件生命周期受益。
评论