写点什么

监控告警

0 人感兴趣 · 12 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/95/951b00b14fe067ed3435c5c5753836d7.png?x-oss-process=image/resize,w_416,h_234

手把手教你基于 Prometheus 搭建监控告警系统

用户头像
Java全栈封神4 月 11 日

IT界有句话很有道理:“不稳定时系统的常态,稳定只是其中的一种表现形式”。作为一个程序员,如何可以在晚上可以安然入眠?如何在假期无虑的玩耍?如何实时掌控自己负责的系统运行状况?搭建一个监控告警系统可以让你睡的更安稳、玩的更开心一些!

https://static001.geekbang.org/infoq/7a/7a31fdc970907ff1b8cb1f0410095703.webp?x-oss-process=image/resize,w_416,h_234

树莓派上的温湿度环境监控

用户头像
冯骐3 月 1 日

前阵子入了一个树莓派,作为一个尽责(苦逼)的IT运维狗,自然想到拿这玩意来做做看看温湿度的环境监控了。

关注直播 走近滴滴夜莺 K8S 监控组件

用户头像
滴滴云1 月 27 日

Obsuite·新生记第二期直播即将上线,欢迎大家于1月30日20:00进入腾讯会议213 975 828 观看直播~

滴滴开源 Logi-KafkaManager 一站式 Kafka 监控与管控平台

用户头像
滴滴云1 月 27 日

滴滴Logi-KafkaManager脱胎于滴滴内部多年的Kafka运营实践经验,是面向Kafka用户、Kafka运维人员打造的共享多租户Kafka云平台。专注于Kafka运维管控、监控告警、资源治理等核心场景,经历过大规模集群、海量大数据的考验。

https://static001.geekbang.org/infoq/28/285aaab800c947e63c7528a49198b006.jpeg?x-oss-process=image/resize,w_416,h_234

Prometheus 官方文档【查询篇 - 运算符】

用户头像
卓丁1 月 10 日

本文主要翻译了云原生监控组件Prometheus的官方文档【查询篇-运算符】,旨在为英文阅读能力欠缺的初学者尽力提供原汁原味的官方资料。

https://static001.geekbang.org/infoq/28/285aaab800c947e63c7528a49198b006.jpeg?x-oss-process=image/resize,w_416,h_234

Prometheus 学习笔记之查询【基础篇】

用户头像
卓丁1 月 9 日

本文主要翻译了云原生监控组件Prometheus的官方文档-查询篇【基础】,旨在为英文阅读能力欠缺的初学者尽力提供原汁原味的官方资料。

TARS 服务信息上报|全方位服务监控

用户头像
TARS基金会2020 年 12 月 24 日

服务上线运营后,出现异常是难免的事,通常情况下会通过服务日志排查问题。然而这种排查问题的方式有时候是低效的,特别是日志比较多,还不知道如何下手的时候。那让服务主动报告出现的错误不就行了吗?本文将对 TARS 中的几种信息上报方式进行介绍。

https://static001.geekbang.org/infoq/ed/edaaa40c11e0470c5098528ba9318c99.png?x-oss-process=image/resize,w_416,h_234

Prometheus 的使用:编写自己的 exporter

用户头像
Rayzh2020 年 12 月 24 日

编写自己的exporter 以memcached为例

https://static001.geekbang.org/infoq/f5/f560f5be002252d640faaa6a4696a4ec.png?x-oss-process=image/resize,w_416,h_234

自建本地电话告警系统

用户头像
周楠2020 年 12 月 16 日

一人千元自建电话告警系统

https://static001.geekbang.org/infoq/e2/e2e01f384f24f8803ac41541de1e8b45.jpeg?x-oss-process=image/resize,w_416,h_234

EMAS 远程日志 - 移动端问题排查利器

用户头像
应用研发平台EMAS2020 年 12 月 16 日

简介: 远程日志是什么?具体做了哪些事情?内部是怎么实现的?本文将从 功能、架构、体验优化三个方面来介绍一下远程日志发展过程及展望。

https://static001.geekbang.org/infoq/5f/5f4fe21dad3298f2d6974d5b89a193f6.jpeg?x-oss-process=image/resize,w_416,h_234

【运维思考】运维对象快速扩展,监控如何精准实时的覆盖?

用户头像
嘉为蓝鲸2020 年 10 月 21 日

基于传统建设监控系统的方式,你会发现如果想要覆盖全面的运维对象,所需建设各种场景监控系统就会越来越多,海量无效的告警事件接踵而来,同时围绕同一故障的告警信息都分布在各个监控系统中,这么一来就很难实现快速的告警定位分析。

https://static001.geekbang.org/infoq/74/7400eba39bd20d64037a16925d43cb43.png?x-oss-process=image/resize,w_416,h_234

开源监控系统 open-falcon 搭建笔记

用户头像
卓丁2020 年 10 月 10 日

搭建开源监控系统open-falcon时可能遇到的一些问题

监控告警_监控告警资料文章-InfoQ写作平台