写点什么

聊聊云厂商的指标监控组件

用户头像
耳东
关注
发布于: 2021 年 04 月 09 日

最近看了很多云厂商的监控部分,每个云厂商都有一个叫做 “云监控” 的服务,用来监控自家的服务运行状态和一些基础指标。比如 AWS 的叫 Cloudwatch、Azure 的叫 Azure Monitor、阿里云以及国内的云基本都叫云监控。通过这些服务可以看到云上服务的状态,比如查看对象存储的带宽、流量、请求成功率等等。通过云监控以及相关的组件,也可以把这些数据导出到 Prometheus 或者在 Grafana 里进行展示。目前对于全球排名前三和国内排名前三的云厂商,都有对应的工具来处理这件事情,我们来一起聊聊。


对于 AWS 来说,AWS 的云监控服务叫做 CloudWatch,开通这个服务就可以查看 AWS 里基本所有服务状态,大约有几十个。接下来有 2 种方式来处理这些数据,一种是在 Grafana 里有一个数据源的插件,也叫 CloudWatch,配置这个数据源就可以在 Grafana 里查询指标;另一种方式就是通过 Prometheus 的 Exporter 将数据导入到 Prometheus 中,在 Grafana 配置 Prometheus 数据源来查看监控数据。Prometheus 官方提供了一个 CloudWatch Exporter 用来将这些数据导给 Prometheus ,组件是用 Java 写的,不过配置文件有点奇怪。一般来说,配置文件都是比较简洁的,比如 Prometheus 的配置文件都是按照节点来进行拉取数据,不需要进行单独配置,但是 CloudWatch Exporter 是需要每个指标用 4 行来进行配置的,收集 10 个指标就需要 40 行,依次类推,采集上百个指标的时候,这个配置文件就像一把大宝剑一样,特别长。


对于 Azure 来说,Azure 的云监控服务叫做 Azure Monitor,开通这个服务可以看到 Azure 里所有的服务的监控数据。对于这些监控数据,和 AWS 一样,也有 2 种处理方式,在 Grafana 中有一个数据源插件,叫做 Azure Monitor ,这数据源是 Grafana Lab 开发的,在 Grafana 中配置以后就可以查看数据,这个组件当前最新版本是 0.3.0 ,是 2018 年更新的,到现在已经 2 年没有更新了,之前简单配置了一下并不能使用。除了 Grafana 的组件以为,Prometheus 的作者 Brian Brazil 也开发了一个组件,叫做 Azure Metric Exporter ,这个组件可以从 Azure 获取数据导入到 Prometheus 中。我对 Azure Metric Exporter 进行了配置,可以获取到 Azure 的监控数据,但是在获取 Stroage Account 监控数据的时候,由于该组件也有一年没有更新了,组件里使用的 2018-02-01 的 ApiVersion,Azure 官网服务的 ApiVersion 已经更新到了 2019-06-01 ,所以只能获取到 Stroage Account 级别的监控数据,无法拿到 Blob、Queue、Table 等级别的数据。


对于 Aliyun 来说,Aliyun 的云监控服务就叫做“云监控”,和其他云厂商一样,开通了可以看到监控数据。对于这些监控数据,Aliyun 自身提供了一个 Grafana 的数据源插件,叫做 aliyun-cms-grafana ,配置这个数据源就可以在 Grafana 里查看 Aliyun 的监控数据,配置过程并不复杂,而且还可以使用。另外 Aliyun 还有一个日志相关的插件,aliyun-log-grafana-datasource-plugin ,使用它在 Grafana 可以使用和控制台一样的语法来查询日志。说回到指标监控,Aliyun 除了官方的 aliyun-cms-grafana 外,吴叶磊也用 Python 写了一个 Aliyun Exporter ,这个组件也很好用,但是吴叶磊后来没有时间维护这个项目,将这个项目归档了。


对于 华为云,华为云自己开源了一个 Exporter 组件,叫做 CloudEye Exporter ,配置这个组件可以拿到 华为云的指标监控,但是这个组件的更新频率也不太高,而且有些服务的监控数据就拿不到,比如对象存储的。


对于腾讯云,腾讯云也开源了一个 Exporter 组件,叫做 TencentCloud Exporter ,配置这个组件就可以拿到腾讯云的指标监控,但是我在按照文档配置的过程中,明明配置是正确的,但是却拿不到数据,已经提工单了,那边回复暂时无法解决,要反馈到后端开发区查找原因。


对于这些云厂商来说,每个厂商都提供了各自的监控工具,有的提供了 Grafana 的数据源插件,有的提供了 Prometheus Exporter,有的好用,有的长久不更新,使用已经是成为问题。


发布于: 2021 年 04 月 09 日阅读数: 39
用户头像

耳东

关注

还未添加个人签名 2020.05.24 加入

主要研究分享运维技术,专注于监控、CICD、操作系统、云原生领域,公众号【耳东学堂】,知识星球同名,坚持原创,希望能和大家在运维路上结伴而行 邮箱:erdong@mail.erdong.site

评论

发布
暂无评论
聊聊云厂商的指标监控组件