0 人感兴趣 · 2 次引用
当下很多团队的运维现状是:监控告警不断、沟通靠拉群、流程靠补工单、执行靠手工操作。短期能解决问题,但长期会带来告警噪声、处置不一致、过程不可追溯、经验难沉淀等问题。
大家有没有发现,随着公司发展,慢慢引入了越来越多的监控、可观测性的系统,云上的、云下的,开源的、商业的,通用的、特定产品的,导致告警事件分散在非常多的地方,形成一个一个的数据孤岛。比如下面这些监控系统,你们应该不止用了一个吧:
每天发掘好玩、好用的AI应用~
提供全面深入的云计算技术干货
InfoQ签约作者