云原生监控高可用集群 Thanos 架构剖析 | 内容合集
随着云原生下监控系统的发展,Prometheus 已经成为指标监控领域最好的选择,但是随着监控数据的增长,单机的 Prometheus 瓶颈凸显,在查询历史数据、通过单个 API 调用进行跨分布式 Prometheus 服务器查询以及合并多个 Prometheus 数据方面存在困难,集群化以及数据长期存储的需求越来越高,那么如何来构建 Prometheus 的高可用集群就成为各大公司的调研目标。
2018 年,英国游戏公司 Improbable 团队开源了 Thanos,并且发布了第一个版本,这是一个通过跨集群联合、跨集群无限存储和全局查询为 Prometheus 增加高可用性的组件。Thanos 的愿景是 “Open source, highly available Prometheus setup with long term storage capabilities”.
在这个内容合集里我们一起来分析一下 Thanos 的基础架构,各个组件是如何使用的,内容基于 Thanos 最新的 v0.23.0 版本进行编写。
作者:耳东 @Erdong
Thanos 作为 Prometheus 的高可用集群解决方案,本文将阐述是以怎么样的架构来实现高可用的。
作者:耳东 @Erdong
Thanos Query 和 Thanos Query Frontend 共同组成了 Thanos 集群查询的统一入口。他们分别都承载了哪些功能。
Thanos 架构剖析(三)如何选择 Sidecar 和 Receiver
作者:耳东 @Erdong
Thanos 对于数据从 Prometheus 到对象存储提供了 2 种解决方式,这两种解决方式是什么,如何选择。
作者:耳东 @Erdong
Thanos 集群收集汇总了大量的监控数据,这些数据要怎么存储,集群在使用过程中有哪些小工具可以提交使用效率,这些问题你一定会在这篇文章找到答案。
作者:耳东 @Erdong
Thanos 提供了长期数据存储的能力,那么这些长期存储的数据怎么办,存储空间的问题如何解决。
作者:耳东 @Erdong
Thanos 通过前边的组件解决了大部分的问题,那么最后告警规则怎么办,这一篇我们来看这个问题。
版权声明: 本文为 InfoQ 作者【耳东@Erdong】的原创文章。
原文链接:【http://xie.infoq.cn/article/26316103ac0c0905bc09453bd】。
本文遵守【CC-BY 4.0】协议,转载请保留原文出处及本版权声明。
评论