Prometheus Exporter (二十二)Infiniband Exporter
本文已经收录在 Prometheus 合集 Prometheus 都可以采集那些指标?-- 常用 Exporter 合集 中。
针对 Infiniband 网络 treydock 开发了一个 Infiniband Exporter 来采集 Infiniband 的监控指标,官方仓库是 https://github.com/treydock/infiniband_exporter ,最新版本是 v0.2.0 ,发布于 2021 年 7 月 3 日,这是一个新的 Exporter,之前监控 HPC 集群的时候,就差 Infiniband 的监控了。
InfiniBand Exporter 从 InfiniBand 交换机和 HCA 收集指标,好的指标从 /metrics
暴露,包含 InfiniBand Exporter 自身的指标和 InfiniBand 的指标。
InfiniBand Exporter 必须在一个主机上运行,该主机在要监控的 InfiniBand fabric 上具有活动接口。默认情况下,Exporter 将从连接到运行的主机的 fabric 的所有交换机端口收集监控数据。
IB 诊断工具 ibnetdiscover 和 perfquery 也必须在运行在这个部署 InfiniBand Exporter 的主机上,这些工具可以通过 infiniband-diags 包安装。
安装运行
InfiniBand Exporter 可以用二进制运行,也可以使用容器来运行。
使用二进制运行需要先下载最新的 InfiniBand Exporter ,然后开始第一步,创建运行的账号,可以使用如下命令。
第二步就是解压下载好的 压缩包,将解压出来的 infiniBand_exporter
文件放到 /usr/local/bin/infiniband_exporter
。
第三步,下载官方提供的 infiniband_exporter.service 文件,并且放到指定的位置,可以就可以使用 SystemD 来启停并且守护进程了。
启动好的 InfiniBand Exporter 会在 9315 端口暴露监控数据。
InfiniBand Exporter 也可以使用容器运行,启动方式可以参考如下:
使用
大型结构注意事项
版权声明: 本文为 InfoQ 作者【耳东@Erdong】的原创文章。
原文链接:【http://xie.infoq.cn/article/de01c8979d44d6b3323e813d9】。未经作者许可,禁止转载。
评论