写点什么

告警管理

0 人感兴趣 · 7 次引用

  • 最新
  • 推荐

企业如何实现良好的告警管理流程?

我们就以嘉为鲸眼告警中心为例,从告警管理流程出发进行“顺藤摸瓜”,对过程中的“告警集中汇聚”、“告警信息丰富”、“告警收敛降噪”三个重要典型场景进行拆解分析,分享企业实现良好告警管理流程的经验。

https://static001.geekbang.org/infoq/2d/2d24a31bc7ec738b3cd2e8bbf43abf94.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

多变的智能降噪

用户头像
睿象云
2021-11-17

告警、作为监控的平台的最直观的体现形式,可以体现出被“监控者”的当前状态,你可以看到它是健康十足的平稳状态,亦或是偶尔发出告警的异常状态,甚至是告警癫狂的崩溃状态,这都是最直观的告诉你他是否需要你的方式。但如果没有好的梳理方式,反而会让人没

https://static001.geekbang.org/infoq/2d/2d24a31bc7ec738b3cd2e8bbf43abf94.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

如何做到监控告警的管理?

用户头像
睿象云
2021-09-27

现在市面上的监控平台有很多,但是针对告警的管理方面的能做的就少之又少,这时候我们就需要一款第三方的平台来提供告警的服务,睿象云智能告警平台Cloud Alert(以下简称CA)就是一款告警管理平台,是针对监控平台的告警所提供的一系列服务

https://static001.geekbang.org/infoq/b4/b435de54d049e7b954c4b69baaccf827.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

关于告警管理的软件,您还只知道 Pagerduty 吗?

用户头像
睿象云
2021-08-26

全面数字化时代,组织业务系统建设复杂,各个服务之间的调用关系多重依赖。一个指标的变化,可能引发一系列的告警连锁反应。不同监控平台的红色标识、不断涌入的告警邮件和短信,紧牵着运维人员的神经,告警管理挑战重重。传统的监控告警工具和故障处理方式已

https://static001.geekbang.org/infoq/04/04cbba42b9a63eda39cd9cf0bdd63ec2.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

运维五一不加班,从一套 On-Call 响应机制开始!

用户头像
睿象云
2021-05-08

互联网技术的发展,离不开运维支撑工作,没有零 BUG 的程序,没有不出问题的系统,问题故障不可怕,可怕的是没能有序的处理故障。尤其对于有数字化服务需要始终在线的业务团队,一个流畅的应用服务增加了对技术团队的要求,要求他们随时准备提供响应。而对于

https://static001.geekbang.org/infoq/50/506cd30b70c3743fbbb7d9cb401bee49.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

AIOps 让「事件管理」变得更加智能

用户头像
睿象云
2021-04-01

AIOps 日益增长的趋势,代表着未来市场积极的发展信号。最终,AIOps 将有能力帮助 IT 团队完成各类最重要任务与最紧迫的事务,例如与业务效能密切相关的应用程序与数字服务可靠性、稳定性以及正常运行时间。

告警管理_告警管理技术文章_InfoQ写作社区