分布式限流框架 - Sentinel
Sentinel 是面向分布式服务架构的轻量级流量控制组件,主要以流量为切入点,从限流、流量整形、服务降级、系统负载保护等多个维度来帮助我们保障微服务的稳定性。
稳定是系统的基础能力,稳定性差的系统会出现服务超时或服务不可用,给用户带来不好的体验,也会对业务造成不良影响。
Sentinel 的特性
Sentinel 有如下特性:
- 应用场景丰富:几乎涵盖所有的应用场景,例如秒杀、消息削峰填谷、集群流量控制等。
- 实时监控:Sentinel 提供了实时监控功能,开发者可以在控制台中看到接入应用的单台机器秒级数据,甚至 500 台以下规模的集群汇总运行情况。
- 支持开源生态:Sentinel 提供开箱即用的与其它开源框架的整合,例如 Spring Cloud、Dubbo、gRPC 的整合。开发者只需要引入相应的依赖并进行简单的配置即可快速接入 Sentinel。
- 支持 SPI 扩展点:Sentinel 提供 SPI 扩展点支持,开发者可以通过扩展点来定制化限流规则,动态数据源适配等需求。
Sentinel 分为两个部分:
- 核心库(Java 客户端):不依赖任何框架,能够运行于所有 Java 运行时环境,同时对 Dubbo、Spring Cloud 等框架也有较好的支持。
- 控制台(Dashboard):基于 Spring Boot 开发,打包后可以直接运行,不需要额外的 Tomcat 等应用容器。
Sentinel 的部署
Sentinel 提供一个轻量级的开源控制台,它支持机器发现以及健康情况管理、监控、规则管理和推送等功能。
Sentinel Dashboard 的安装步骤如下:
- 在 GitHub 中 Sentinel 的源码仓库中下载源码或者下载已经构建好的 jar
- 通过以下命令启动控制台
默认登陆的用户名和密码都是 sentinel
Sentinel 的基本应用
Sentinel 实现限流
使用 Sentinel 的核心库实现限流,主要分以下几个步骤:
- 定义资源
- 定义限流规则
- 检验规则是否生效
资源就是通过限流保护的基本元素,比如一个方法。
首先需要引入 Sentinel 的核心库:
然后定义一个普通的业务方法:
在 testSentinel 方法中,通过使用 Sentinel 中的 SphU.entry("testSentinel")定义一个资源来实现流控的逻辑,它表示当请求进入 testSentinel 方法时,需要进行限流判断,如果抛出 BlockException 异常, 则表示触发了限流。
接着我们要针对这个需要保护的资源定义限流规则:
对于资源 testSentinel,通过 initFlowRules 方法设置限流规则,其中的参数含义如下:
- Grade: 限流阈值类型,QPS 模式或者并发线程数模式
- count: 限流阈值
- resource: 设置需要保护的资源,这个资源的名称必须与 SphU.entry 中使用的名称保持一致
所以,上面代码的意思是对于 testSentinel 这个方法,每秒钟最多允许通过 20 个请求。
最后,通过 main 方法进行测试:
运行 main 方法之后,可以在 ${USER_HOME}/logs/csp/${包名-类名}-metrics.log.date 文件中看到如下日志:
上述日志对应字段的含义如下:
从日志中可以看出,这个程序每秒稳定输出 20 次,和规则中预先设定的阈值是一样的,而每秒被拒绝的请求高达 60 多万次。
资源的定义方式
在上面的例子中,我们通过抛出异常的方式来定义一个资源,也就是当资源被限流后,会抛出一个 BlockException 异常,这时我们需要捕获该异常进行限流后的处理:
其中,resourceName 可以定义方法名称、接口名称或者其它的唯一标识。
除此之外,还可以通过返回布尔值的方式来定义资源:
在这种方式中,需要注意资源使用完成之后需要调用 SphO.exit(),否则会导致调用链记录异常,抛出 ErrorEntryFreeException 异常。
Sentinel 还可以使用 @SentinelResource 支持注解的方式来定义资源:
需要注意的是,blockHandler 所配置的值 blockHandlerForUserName 会在触发限流之后调用,这个方法的定义必须和原始方法 findUserName 的返回值、参数保持一直,而且要增加 BlockException 参数。
Sentinel 实现服务熔断
Sentinel 实现服务熔断操作的配置和限流类似,不同之处在于限流采用的是 FlowRule,而熔断中采用的是 DegradeRule:
其中几个属性的说明如下:
- grade: 熔断策略,支持秒级 RT、秒级异常比例、分钟级异常数。默认是秒级 RT
- timeWindow: 熔断降级的时间窗口,单位为 s,也就是触发熔断降级之后多长时间内自动熔断。
- rtSlowRequestAmount: 在 RT 模式下,1s 内持续多少个请求的平均 RT 超出阈值后触发熔断,默认值是 5.
- minRequestAmount: 触发的异常熔断最小请求数,请求数小于该值时即使异常比例超出阈值也不会触发熔断,默认值是 5。
Sentinel 提供三种熔断策略,对于不同策略,参数的含义也不相同。
- 平均响应时间(RuleConstant.DEGRADEGRADERT): 如果 1s 内持续进入 5 个请求,对应的平均响应时间都超过了阈值(count,单位为 ms),那么在接下来的时间窗口(timeWindow,单位为 s)内,对这个方法的调用都会自动熔断,抛出 DegradeException。
- 异常比例(RuleConstant.DEGRADEGRADEEXCEPTION_RATIO):如果每秒资源数大于等于 minRequestAmount(默认值为 5),并且每秒的异常总数占总通过量的比例超过阈值 count(count 的取值范围是[0.0,1.0],代表 0% ~ 100%),则资源将进入降级状态。同样,在接下来的 timeWindow 之内,对于这个方法的调用都会自动触发熔断。
- 异常数(RuleConstant.DEGRADEGRADEEXCEPTION_COUNT):当资源最近一分钟的异常数目超过阈值之后,会触发熔断。需要注意的是,如果 timeWindow 小于 60s,则结束熔断状态后仍然可能再进入熔断状态。
到此,我们对 Sentinel 已经有了基本的了解。
版权声明: 本文为 InfoQ 作者【Java收录阁】的原创文章。
原文链接:【http://xie.infoq.cn/article/a7c3f696ec2d8034588973cfa】。文章转载请联系作者。
评论