写点什么

云原生监控高可用集群 Thanos 架构剖析 | 内容合集

作者:耳东@Erdong
  • 2021 年 12 月 15 日
  • 本文字数:829 字

    阅读完需:约 3 分钟

云原生监控高可用集群 Thanos 架构剖析 | 内容合集

随着云原生下监控系统的发展,Prometheus 已经成为指标监控领域最好的选择,但是随着监控数据的增长,单机的 Prometheus 瓶颈凸显,在查询历史数据、通过单个 API 调用进行跨分布式 Prometheus 服务器查询以及合并多个 Prometheus 数据方面存在困难,集群化以及数据长期存储的需求越来越高,那么如何来构建 Prometheus 的高可用集群就成为各大公司的调研目标。

2018 年,英国游戏公司 Improbable 团队开源了 Thanos,并且发布了第一个版本,这是一个通过跨集群联合、跨集群无限存储和全局查询为 Prometheus 增加高可用性的组件。Thanos 的愿景是 “Open source, highly available Prometheus setup with long term storage capabilities”.

在这个内容合集里我们一起来分析一下 Thanos 的基础架构,各个组件是如何使用的,内容基于 Thanos 最新的 v0.23.0 版本进行编写。


Thanos 架构剖析(一)Thanos 架构总览

作者:耳东 @Erdong

Thanos 作为 Prometheus 的高可用集群解决方案,本文将阐述是以怎么样的架构来实现高可用的。


Thanos 架构剖析(二)统一的查询入口

作者:耳东 @Erdong

Thanos Query 和 Thanos Query Frontend 共同组成了 Thanos 集群查询的统一入口。他们分别都承载了哪些功能。


Thanos 架构剖析(三)如何选择 Sidecar 和 Receiver

作者:耳东 @Erdong

Thanos 对于数据从 Prometheus 到对象存储提供了 2 种解决方式,这两种解决方式是什么,如何选择。


Thanos 架构剖析(四)数据存储和运维工具

作者:耳东 @Erdong

Thanos 集群收集汇总了大量的监控数据,这些数据要怎么存储,集群在使用过程中有哪些小工具可以提交使用效率,这些问题你一定会在这篇文章找到答案。


Thanos 架构剖析(五)历史数据怎么办

作者:耳东 @Erdong

Thanos 提供了长期数据存储的能力,那么这些长期存储的数据怎么办,存储空间的问题如何解决。


Thanos 架构剖析(六)告警规则如何管理

作者:耳东 @Erdong

Thanos 通过前边的组件解决了大部分的问题,那么最后告警规则怎么办,这一篇我们来看这个问题。

发布于: 19 小时前阅读数: 22
用户头像

耳东@Erdong

关注

还未添加个人签名 2020.05.24 加入

主要研究分享运维技术,专注于监控、CICD、操作系统、云原生领域,公众号【耳东学堂】,知识星球同名,坚持原创,希望能和大家在运维路上结伴而行 邮箱:erdong@mail.erdong.site

评论

发布
暂无评论
云原生监控高可用集群 Thanos 架构剖析 | 内容合集