使用 RED 方法分析服务的瓶颈
RED 方法是 Weave Cloud 基于 Google 的 4 个黄金指标的原则下结合 Prometheus 以及 Kubernetes 容器编排管理实践以后,细化和总结的方法论。这个方法特别适合于云原生应用以及微服务架构应用的监控和度量。 RED 方法主要关注应用的三种关键指标:
* 请求的速率:这个服务每秒可以接收的请求数量。
* 请求的错误:这个服务每秒接受的请求中失败的数量。
* 请求的耗时:这个服务每个请求的消耗的时间。
在 4 大黄金指标的原则下,RED 方法可以有效的帮助用户衡量云原生应用以及微服务应用下的用户体验是什么,当请求的速率变慢,错误数量增加、耗时增加,任何一个原因都会导致用户的体验变差。
以请求耗时为例,当用户打开一个页面,整个耗时为 3s 以内的时候,用户感觉尚可,没有其他不良的体验,但是当这个消耗的时候增加到 5s 的时候,用户会感觉这个时间太久了,当这个时间超过 10s 的时候,用户就放弃了,接下来用不了多久,用户就会放弃这个应用。公司就流失了这部分用户。
所以我们对于这 3 个指标最好设置为 SLI ,作为团队的目标,来定期进观察,如果出现异常,一定要尽快排查处理,这样才能提高应用的质量,提升用户体验。
对于 RED 方法,只在 Google 的书中提出过,在国内好像很少有用户在公开的演讲和资料中单独提及这个方法,网络上查找关于 RED 的资料,基本找不到。后续更多的资料以后我会继续聊聊这个方法的实用性。
版权声明: 本文为 InfoQ 作者【耳东@Erdong】的原创文章。
原文链接:【http://xie.infoq.cn/article/5bd1589edbdf599c4f2f13b67】。未经作者许可,禁止转载。
评论