使用 USE 方法分析系统性能瓶颈
USE 方法全称 "Utilization Saturation and Errors Method",主要用于分析系统性能问题,可以指导运维人员快速识别资源瓶颈和系统错误。正如 USE 方法的名字所表示的含义,USE 方法主要关注系统资源的:使用率(Utilization)、饱和度(Saturation)以及错误(Errors)。
使用率:系统资源的使用情况。这里的资源包括但不限于:CPU,内存,网络,磁盘等,使用率达到 100% 的时候也就意味着系统在这个资源维度达到了瓶颈。
饱和度:比如 CPU 的平均运行排队长度,这里主要是针对资源的饱和度,这个饱和度不同于前边的 4 个黄金指标的饱和度。任何资源的饱和度上涨到一定程度都会导致系统的性能下降。
错误:错误次数。每次在固定的时间长度内对某项指标的错误进行计数,当错误次数上涨的情况下,那么一定是达到了该项资源的瓶颈。
当对某项资源的上述指标进行持续观察,就可以发现系统的瓶颈。一般会经历这样的过程:
首先是确定要观察的指标,接着当发生错误的时候去排查问题、发现使用率上涨的时候也去排查问题、发现饱和度过高的时候也去排查问题,通过排查问题发现问题原因,然后解决问题,然后继续观察确定的指标,这样就形成了一个循环,通过这个循环不断地运转,来不断地发现系统的瓶颈。
当然这个循环每次不是只观察一个指标,而是一系列的指标一起观察。
版权声明: 本文为 InfoQ 作者【耳东@Erdong】的原创文章。
原文链接:【http://xie.infoq.cn/article/7ea07ce2fc759bd7a65046c44】。未经作者许可,禁止转载。
评论