SLO
0 人感兴趣 · 7 次引用
- 最新
- 推荐

基于 SLO 告警(Part 4):开源项目 pyrra 使用
系列文章第3篇我们讲到如何使用 sloth 进行 Prometheus 规则的自动生成和 SLO 统一观测,今天我们再来看另外一个类似的开源项目 -- pyrra。

基于 SLO 告警(Part 3):开源项目 sloth 使用
本文主要讲解如何围绕 sloth 进行 SLO 建设,使用它不仅可以高效的生成大量 Prometheus rules 配置文件,还可以通过开箱即用的统一看板对多个服务的 SLO 进行观测。
基于 SLO 告警(Part 2):为什么使用 MWMB 方法
本篇文章为《基于 SLO 告警》系列文章第2篇,主要讲解基于 SLO 告警一般使用方法以及为什么要使用多窗口多燃烧率(MWMB)的方式。

基于 SLO 告警(Part 1):基础概念
看过 Google 网站可靠性工作手册 一书的朋友都知道,该书在第一部分重点讲解了基于 SLO 的告警监控相关知识,可见基于 SLO 的监控告警已然成为一种趋势,那在实际工作中,我们该如何实施和落地 SLO 监控告警呢?

SLO 新解,一种行之有效的故障处理方法
本文主要不是普及 SLO 概念,而是分析"跟风"SLO方法时可能出现的错误,并介绍一种应用于故障处理场景,并行之有效的"类SLO"实践。


SRE 灵魂之 SLI 和 SLO
已经有很多文章讨论什么是SLI, SLO, SLA,它们是有什么关系,为什么它们很重要以及通常有哪些指标当作SLI,比如著名的RED原则,USE,但是如何设置合理的SLO呢?这里主要讨论若干怎么制定良好SLI,SLO的准则。