Prometheus 运维工具 Promtool (一)Check 功能
Promtool 是 Prometheus 提供的一个运维工具,用来对 Prometheus 进行检查,之前只有最简单的检查配置文件和规则文件的功能,现在已经有了更多的新功能,包括查询指标、debug 服务、对数据库进行检查等等。这次我们基于 2.37.0 版本进行一次梳理,如果版本低于这个版本,在使用前请确认要用到的功能是否已经添加,如果是版本比 2.37.0 高,请检查相关功能是否有更新。
查看 Promtool 工具的帮助信息可以看到如下信息:
基本信息
这个工具有一些基本信息可以使用,一些参数基本是通用的。
首先 使用 --help
可以看到帮助信息,也可以使用 --help-long
参数看加长版的帮助信息
使用 --version
可以看到工具版本信息、构建的分支和 commit ID、构建时间、Go 的版本、运行平台这些信息。
使用 Promtool 还可以校验一些新的特性的功能,使用 --enable-feature=
参数来开启,多个参数使用逗号隔开。相关的特性需要参考 https://prometheus.io/docs/prometheus/latest/feature_flags/ 链接。
使用 Promtool 进行检查
检查服务发现
使用 Promtool 可以检查配置文件中的服务发现配置,防止配置错误导致程序无法启动,或者启动后无法正常发现内容。
具体命令参数为
使用过程中需要指定 Prometheus 的配置文件,以及要检查的服务发现的 job 名称。Promtool 在检查过后会返回检查结果,并且会包含 relable 的内容。
实验结果如下,这命令返回了所有能发现的信息,即使 job 里配置了只要发现特定名称的 pod 即可。
检查配置文件
使用 Promtool 可以检查 Prometheus 的启动配置文件是否正确。参数如下:
我们执行命令来看一下:
看到 SUCCESS 就表示这个配置文件是正常可以使用的,如果出现错误会进行提示。
检查 web-config
使用 Promtool 可以检查 web-config 配置文件
检查告警规则和记录规则
使用 Promtool 可以检查告警规则和记录规则文件
如果文件正常会输出 SUCCESS 的提示,如果文件不正常会输出对应的提示。
检查指标
使用 Promtool 可以检查指标,命令参数如下
使用方式可以是以下两种中的任意一种。
执行结果如下所示:
总结
上边就是 Promtool 提供的所有的检查功能,明天我们来看 Promtool 的其他功能。
版权声明: 本文为 InfoQ 作者【耳东@Erdong】的原创文章。
原文链接:【http://xie.infoq.cn/article/282b2c3dda01eed58fb035461】。未经作者许可,禁止转载。
评论