写点什么

SLO

0 人感兴趣 · 7 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/11/11ab9a10158ea8ab9fb1682095a799a8.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于 SLO 告警(Part 4):开源项目 pyrra 使用

系列文章第3篇我们讲到如何使用 sloth 进行 Prometheus 规则的自动生成和 SLO 统一观测,今天我们再来看另外一个类似的开源项目 -- pyrra。

https://static001.geekbang.org/infoq/d1/d14b69d588f366ae262760e83966f06c.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于 SLO 告警(Part 3):开源项目 sloth 使用

本文主要讲解如何围绕 sloth 进行 SLO 建设,使用它不仅可以高效的生成大量 Prometheus rules 配置文件,还可以通过开箱即用的统一看板对多个服务的 SLO 进行观测。

基于 SLO 告警(Part 2):为什么使用 MWMB 方法

本篇文章为《基于 SLO 告警》系列文章第2篇,主要讲解基于 SLO 告警一般使用方法以及为什么要使用多窗口多燃烧率(MWMB)的方式。

https://static001.geekbang.org/infoq/a7/a7033900b04b3a1e107f519f1b2326b9.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

基于 SLO 告警(Part 1):基础概念

看过 Google 网站可靠性工作手册 一书的朋友都知道,该书在第一部分重点讲解了基于 SLO 的告警监控相关知识,可见基于 SLO 的监控告警已然成为一种趋势,那在实际工作中,我们该如何实施和落地 SLO 监控告警呢?

https://static001.geekbang.org/infoq/28/28b4004f32e266b2d935b8453b9073d4.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

SLO 新解,一种行之有效的故障处理方法

用户头像
华明
2022-09-07

本文主要不是普及 SLO 概念,而是分析"跟风"SLO方法时可能出现的错误,并介绍一种应用于故障处理场景,并行之有效的"类SLO"实践。

https://static001.geekbang.org/infoq/4b/4b965cb85f8415ccd3cb4477ddc70641.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

数据点按时间间隔以及数据值分割数据块

用户头像
waitmoon
2022-08-24

在SLO等分析场景中,常常会保存一些异常数据点,如何根据这些数据点简单分隔出更有价值且传输消耗更小的分割区间?

https://static001.geekbang.org/infoq/67/67e4df26b75ad6c7c320b7190a43c5bf.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

SRE 灵魂之 SLI 和 SLO

已经有很多文章讨论什么是SLI, SLO, SLA,它们是有什么关系,为什么它们很重要以及通常有哪些指标当作SLI,比如著名的RED原则,USE,但是如何设置合理的SLO呢?这里主要讨论若干怎么制定良好SLI,SLO的准则。

SLO_SLO技术文章_InfoQ写作社区