写点什么

Prometheus Exporter (二十二)Infiniband Exporter

作者:耳东@Erdong
  • 2021 年 12 月 10 日
  • 本文字数:889 字

    阅读完需:约 3 分钟

Prometheus Exporter (二十二)Infiniband Exporter

本文已经收录在 Prometheus 合集 Prometheus 都可以采集那些指标?-- 常用 Exporter 合集 中。


针对 Infiniband 网络 treydock 开发了一个 Infiniband Exporter 来采集 Infiniband 的监控指标,官方仓库是 https://github.com/treydock/infiniband_exporter ,最新版本是 v0.2.0 ,发布于 2021 年 7 月 3 日,这是一个新的 Exporter,之前监控 HPC 集群的时候,就差 Infiniband 的监控了。


InfiniBand Exporter 从 InfiniBand 交换机和 HCA 收集指标,好的指标从 /metrics 暴露,包含 InfiniBand Exporter 自身的指标和 InfiniBand 的指标。


InfiniBand Exporter 必须在一个主机上运行,该主机在要监控的 InfiniBand fabric 上具有活动接口。默认情况下,Exporter 将从连接到运行的主机的 fabric 的所有交换机端口收集监控数据。


IB 诊断工具 ibnetdiscover 和 perfquery 也必须在运行在这个部署 InfiniBand Exporter 的主机上,这些工具可以通过 infiniband-diags 包安装。

安装运行

InfiniBand Exporter 可以用二进制运行,也可以使用容器来运行。


使用二进制运行需要先下载最新的 InfiniBand Exporter ,然后开始第一步,创建运行的账号,可以使用如下命令。


groupadd -r infiniband_exporteruseradd -r -d /var/lib/infiniband_exporter -s /sbin/nologin -M -g infiniband_exporter -M infiniband_exporter
复制代码


第二步就是解压下载好的 压缩包,将解压出来的 infiniBand_exporter 文件放到 /usr/local/bin/infiniband_exporter


第三步,下载官方提供的 infiniband_exporter.service 文件,并且放到指定的位置,可以就可以使用 SystemD 来启停并且守护进程了。


cp systemd/infiniband_exporter.service /etc/systemd/system/infiniband_exporter.servicesystemctl daemon-reloadsystemctl start infiniband_exporter
复制代码


启动好的 InfiniBand Exporter 会在 9315 端口暴露监控数据。


InfiniBand Exporter 也可以使用容器运行,启动方式可以参考如下:


docker run -d -p 9315:9315 \--name infiniband_exporter \--cap-add=IPC_LOCK \--device=/dev/infiniband/umad0 \treydock/infiniband_exporter
复制代码

使用

大型结构注意事项

发布于: 2 小时前阅读数: 7
用户头像

耳东@Erdong

关注

还未添加个人签名 2020.05.24 加入

主要研究分享运维技术,专注于监控、CICD、操作系统、云原生领域,公众号【耳东学堂】,知识星球同名,坚持原创,希望能和大家在运维路上结伴而行 邮箱:erdong@mail.erdong.site

评论

发布
暂无评论
Prometheus Exporter (二十二)Infiniband Exporter