webhook 告警配置
作者: weixiaobing 原文来源:https://tidb.net/blog/a425463a
1、配置告警
1、下载并解压告警安装包
2、配置 webhook 启动脚本
3、配置 webhook 配置文件
4、配置 alertmanager.yml
5、配置开机启动脚本
6、启动 webhook
7、重启 alertmanager 让告警生效
8、告警展示
9、注意事项
需要注意的是,TiUP 会使用自己的配置参数覆盖监控组件的配置,如果你直接修改监控组件的配置文件,修改的配置文件可能在对集群进行 deploy/scale-out/scale-in/reload 等操作中被 TiUP 所覆盖,导致配置不生效。
alertmanager_servers
config_file:该字段指定一个本地文件,该文件会在集群配置初始化阶段被传输到目标机器上,作为 Alertmanager 的配置
2、修改告警
1、到 prometheus 的 conf 目录下找到对应的告警项
2、备份相应的文件,修改告警项
3、重启 prometheus,让修改生效
4、临时静默
https://yunlzheng.gitbook.io/prometheus-book/parti-prometheus-ji-chu/alert/alert-manager-inhibit
用户或者管理员可以直接通过 Alertmanager 的 UI 临时屏蔽特定的告警通知。通过定义标签的匹配规则 (字符串或者正则表达式),如果新的告警通知满足静默规则的设置,则停止向 receiver 发送通知。
进入 Alertmanager UI,点击 ”New Silence” 显示如下内容:
1、创建静默规则
用户可以通过该 UI 定义新的静默规则的开始时间以及持续时间,通过 Matchers 部分可以设置多条匹配规则 (字符串匹配或者正则匹配)。填写当前静默规则的创建者以及创建原因后,点击 ”Create” 按钮即可。
通过 ”Preview Alerts” 可以查看预览当前匹配规则匹配到的告警信息。静默规则创建成功后,Alertmanager 会开始加载该规则并且设置状态为 Pending, 当规则生效后则进行到 Active 状态。
活动的静默规则
当静默规则生效以后,从 Alertmanager 的 Alerts 页面下用户将不会看到该规则匹配到的告警信息。
告警信息
对于已经生效的规则,用户可以通过手动点击”Expire“按钮使当前规则过期。
版权声明: 本文为 InfoQ 作者【TiDB 社区干货传送门】的原创文章。
原文链接:【http://xie.infoq.cn/article/b92e2bfa5639ecdb6380bad7b】。文章转载请联系作者。
评论