Grafana 汇总报表
作者: 18515065291 原文来源:https://tidb.net/blog/8143b7c4
Grafana 汇总报表
–2020-09-23 刘春雷
1、背景
自 58 同城部署 TiDB 数据库后,集群数量快速增长,截止目前,已经 52 套集群,300 台服务器;
由于 TiDB 的监控都是每套集群单独部署的,单个 Grafana 只能看单套集群的监控,很全面,但面对众多的集群,如何快速方便的查看所有集群的重要指标呢?如何节前快速排查呢?
2、实现方式
58 同城 TiDB 数据库,当前监控展示实现方式为:任务抽取 prometheus 的监控数据至当前监控系统,zabbix 实现,再通过 zabbix 接口,拉取数据,在内部数据库平台 CDB 上展示,给 DBA 及开发人员查看,同样查看方式为 1 套集群。
思考实现方式:
【1】、通过 zabbix 拉取所有集群重点监控至数据库平台 CDB 进行展示,但因中途经转 zabbix,实效性会有影响, 放弃~
【2】、通过每个监控图的分享模式,例如 iframe 方式,整体汇总指定时间段的监控图,测试几套集群的套可以,但 50 多套同时通过此方式查看,效率比较差, 放弃~
【3】、新搭建 1 套独立的 grafana,配置所有集群的 prometheus 数据源,load 重点监控的 json 文件,例如 overview,以集群为单位,进行展示, 可以~
【4】、但 3 方式快速查看所有集群的重点监控,还是需要点击、回退等,比较麻烦。便进行新建 dashborad,添加图表,将重点监控图的配置复制上,然后查看 json 配置,写个小工具,生成所有集群的此 json 文件,替换配置即可,这样就可以快速查看所有集群的重点监控项了, 可以~
如果大家有更好的方式,也可以相互交流下哈~
3、效果
单独搭建 grafana,界面如下,分为:
所有集群重点监控项汇总 dashboard
所有集群的 Overview
所有集群的重点监控项,暂时取了 2 项,后续可以继续添加即可
Druation,
Statement OPS
所有集群的 Overview,同每套 Grafana 的 Overview 一样的,只是汇总至一个 Grafana,方便快速查看~
版权声明: 本文为 InfoQ 作者【TiDB 社区干货传送门】的原创文章。
原文链接:【http://xie.infoq.cn/article/6ccf67fb739e947fe56164c46】。文章转载请联系作者。
评论