多变的智能降噪
告警、作为监控的平台的最直观的体现形式,可以体现出被“监控者”的当前状态,你可以看到它是健康十足的平稳状态,亦或是偶尔发出告警的异常状态,甚至是告警癫狂的崩溃状态,这都是最直观的告诉你他是否需要你的方式。但如果没有好的梳理方式,反而会让人没办法正确的发现它此时的情况,今天我们就来说下如何通过智能告警平台 Cloud Aler 中的智能降噪的功能,实现告警的灵活处理。
睿象云智能降噪 Cloud Alert 中,有三种降噪的类别,分别为:自定义规则降噪、时间窗口智能降噪、实时智能降噪;分为两种降噪方式,一种是单点降噪,一种是序列降噪。
【自定义规则降噪】用户可以通过自行设置规则的方式,让满足规则的告警产生压缩,从而让告警有序的压缩去重,减少不必要的告警通知;例如可以设置指定内容的告警进行压缩,也可以设置指定主机+指定内容的告警组合的方式进行压缩。如果对告警和整个监控业务逻辑比较清楚的用户,就比较推荐这种方式了。
【时间窗口智能降噪】是通过选定指定的时间段,让指定的时间段的告警进行压缩降噪,这种方式就是让时间点和平台自有的降噪算法相结合,这种降噪的类别对于总是在某个时间段内产生异常的监控有出奇的效果,用户可以清楚地观察到某些时间段内激增的告警中,主要的告警有哪些,进而更快的排查到问题的根因。
【实时智能降噪】在勾选了算法降噪之后,平台就会实时监控告警数据,满足算法降噪需求的告警,就会产生压缩,从而过滤掉一些不必要的通知,让告警不在烦乱复杂。对于用户的监控平台告警繁多且复杂的用户,就比较推荐这种方式了。
对于使用场景,用户可以选择一种降噪类别进行单点降噪的方式,例如如果用户深知自己的告警逻辑和场景情况,推荐使用自定义规则降噪的方式,这样更加的精准且直接,结果也是最高效的一种方式;亦或是用户的监控在一天的时间内总是在某个时间段内告警量激增,也没有什么规律性,就比较推荐时间窗智能降噪的方式,这样的告警的通知就既不会在某个时间段内突然激增,进而对用户造成烦扰,又能通过降噪的方式让用户更快的查找到问题的根因;如果监控平台一天内产生的告警量较大,或者业务上的告警频繁,且产生的频率比较平稳,这时候就更推荐使用实时智能降噪的方式进行压缩降噪了,这样就能实时的减少一些不必要的通知,全天的告警查找问题也更加的直接。
用户也可以选择序列降噪的方式,就比方说用户的每天的监控每天产生的告警量较大,也明确部分的告警产生的逻辑,但是单一设置自定义压缩规则所压缩的效果又不是很理想,这时候就可以通过设置自定义压缩规则和实时智能降噪组合的方式,将自定义压缩规则优先级设置为 1,实时智能降噪的方式优先级设置为 2,这样产生的告警,会先判断是否满足自定义压缩规则,如果满足就会按照用户设定的规则进行压缩,如果不满足就会按照实时智能降噪的方式进行压缩降噪,从而让告警压缩效果达到最大化;同样的,如果用户一天的告警频率不定,或者某时间段内的告警量激增,想看到激增的告警中,主要的告警有哪些,又想让某些指标的告警特定压缩通知,这样就可以通过设置自定义压缩规则和时间窗口智能降噪组合的方式,达到一个最佳的理想效果,以上就是本次的智能降噪方式的推荐,希望能给你带来一些帮助吧~
版权声明: 本文为 InfoQ 作者【睿象云】的原创文章。
原文链接:【http://xie.infoq.cn/article/9490897183c88177a8bc0a6e9】。文章转载请联系作者。
评论