写点什么

深扒 Sentinel 背后的实现原理之后,我终于明白它为什么这么强了

作者:Java你猿哥
  • 2023-04-25
    湖南
  • 本文字数:7833 字

    阅读完需:约 26 分钟

最近我在整理代码仓库的时候突然发现了被尘封了接近两年之久的 Sentinel 源码库

两年前我出于好奇心扒了一下 Sentinel 的源码,但是由于 Sentinel 本身源码并不复杂,在简单扒了扒之后几乎就再没扒过了

那么既然现在又让我看到了,所以我准备再来好好地扒一扒,然后顺带写篇文章来总结一下。

Sentinel 简介

Sentinel 是阿里开源的一款面向分布式、多语言异构化服务架构的流量治理组件。

主要以流量为切入点,从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开发者保障微服务的稳定性。

上面两句话来自 Sentinel 官网的自我介绍,从这短短的两句话就可以看出 Sentinel 的定位和拥有的强大功能。


核心概念

要想理解一个新的技术,那么首先你得理解它的一些核心概念

资源

资源是 Sentinel 中一个非常重要的概念,资源就是 Sentinel 所保护的对象。

资源可以是一段代码,又或者是一个接口,Sentinel 中并没有什么强制规定,但是实际项目中一般以一个接口为一个资源,比如说一个 http 接口,又或者是 rpc 接口,它们就是资源,可以被保护。

资源是通过 Sentinel 的 API 定义的,每个资源都有一个对应的名称,比如对于一个 http 接口资源来说,Sentinel 默认的资源名称就是请求路径。

规则

规则也是一个重要的概念,规则其实比较好理解,比如说要对一个资源进行限流,那么限流的条件就是规则,后面在限流的时候会基于这个规则来判定是否需要限流。

Sentinel 的规则分为流量控制规则、熔断降级规则以及系统保护规则,不同的规则实现的效果不一样。

来个 Demo

为了兼顾文章的完整性和我一贯的风格,必须要来个 demo,如果你已经使用过了 Sentinel,那么就可以直接 pass 这一节,直接快进到核心原理。

1、基本使用

引入依赖

<dependency>    <groupId>com.alibaba.csp</groupId>    <artifactId>sentinel-core</artifactId>    <version>1.8.6</version></dependency>
复制代码

测试代码

public class SentinelSimpleDemo {
public static void main(String[] args) { //加载流控规则 initFlowRules();
for (int i = 0; i < 5; i++) { Entry entry = null; try { entry = SphU.entry("sayHello"); //被保护的逻辑 System.out.println("访问sayHello资源"); } catch (BlockException ex) { System.out.println("被流量控制了,可以进行降级处理"); } finally { if (entry != null) { entry.exit(); } } } }
private static void initFlowRules() { List<FlowRule> rules = new ArrayList<>();
//创建一个流控规则 FlowRule rule = new FlowRule(); //对sayHello这个资源限流 rule.setResource("sayHello"); //基于qps限流 rule.setGrade(RuleConstant.FLOW_GRADE_QPS); //qps最大为2,超过2就要被限流 rule.setCount(2);
rules.add(rule);
//设置规则 FlowRuleManager.loadRules(rules); }
}
复制代码

解释一下上面这段代码的意思

  • initFlowRules 方法就是加载一个限流的规则,这个规则作用于 sayHello 这个资源,基于 qps 限流,当 qps 超过 2 之后就会触发限流。

  • SphU.entry("sayHello")这行代码是 Sentinel 最最核心的源码,这行代码表面看似风平浪静,实则暗流涌动。这行代码表明接下来需要访问某个资源(参数就是资源名称),会去检查需要被访问的资源是否达到设置的流控、熔断等规则。对于 demo 来说,就是检查 sayHello 这个资源是否达到了设置的流量控制规则。

  • catch BlockException 也很重要,当抛出 BlockException 这个异常,说明触发了一些设置的保护规则,比如限流了,这里面就可以进行降级操作。

  • System.out.println("访问 sayHello 资源")这行代码表面是一个打印语句,实则就是前面一直在说的需要被保护的资源。

所以上面这段代码的整体意思就是对 sayHello 这个需要访问的资源设置了一个流控规则,规则的内容是当 qps 到达 2 的时候触发限流,之后循环 5 次访问 sayHello 这个资源,在访问之前通过 SphU.entry("sayHello")这行代码进行限流规则的检查,如果达到了限流的规则的条件,会抛出 BlockException。

测试结果


从结果可以看出,当前两次访问 sayHello 成功之后,qps 达到了 2,之后再访问就被限流了,失败了。

2、集成 Spring

在实际的项目使用中一般不会直接写上面的那段 demo 代码,而是集成到 Spring 环境底下。

引入依赖

<dependency>    <groupId>org.springframework.boot</groupId>    <artifactId>spring-boot-starter-web</artifactId>    <version>2.2.5.RELEASE</version></dependency><dependency>    <groupId>com.alibaba.cloud</groupId>    <artifactId>spring-cloud-starter-alibaba-sentinel</artifactId>    <version>2.2.5.RELEASE</version></dependency>
复制代码

之后提供一个/sayHello 接口

@RestControllerpublic class SentinelDemoController {
@GetMapping("/sayHello") public String sayHello() throws InterruptedException { return "hello"; }
}
复制代码

配置文件

server:  port: 9527  spring:  application:    name: SentinelDemo
复制代码

到这 demo 就搭建完成了。


此时你心理肯定有疑问,那前面提到的资源和对应的规则去哪了?


前面在说资源概念的时候,我提到 Sentinel 中默认一个 http 接口就是一个资源,并且资源的名称就是接口的请求路径。


而真正的原因是 Sentinel 实现了 SpringMVC 中的 HandlerInterceptor 接口,在调用 Controller 接口之前,会将一个调用接口设置为一个资源,代码如下


而 getResourceName 方法就是获取资源名,其实就是接口的请求路径,比如前面提供的接口路径是/sayHello,那么资源名就是/sayHello。

再后面的代码就是调用上面 demo 中提到表面风平浪静,实则暗流涌动的 SphU.entry(..)方法,检查被调用的资源是否达到了设置的规则。


好了,既然资源默认是接口,已经有了,那么规则呢?


规则当然可以按照第一个 demo 的方式来做,比如在 Controller 接口中加载,代码如下。

@RestControllerpublic class SentinelDemoController {
static { List<FlowRule> rules = new ArrayList<>();
//创建一个流控规则 FlowRule rule = new FlowRule(); //对/sayHello这个资源限流 rule.setResource("/sayHello"); //基于qps限流 rule.setGrade(RuleConstant.FLOW_GRADE_QPS); //qps最大为2,超过2就要被限流 rule.setCount(2);
rules.add(rule);
//设置规则 FlowRuleManager.loadRules(rules); }
@GetMapping("/sayHello") public String sayHello() throws InterruptedException { return "hello"; }
}
复制代码

此时启动项目,在浏览器输入以下链接

http://localhost:9527/sayHello

疯狂快速使劲地多点几次,就出现下面这种情况


可以看出规则生效了,接口被 Sentinel 限流了,至于为什么出现这个提示,是因为 Sentinel 有默认的处理 BlockException 的机制,就在前面提到的进入资源的后面。


当然,你也可以自定义处理的逻辑,实现 BlockExceptionHandler 接口就可以了。

虽然上面这种硬编码规则的方式可以使用,但是在实际的项目中,肯定希望能够基于系统当期那运行的状态来动态调整规则,所以 Sentinel 提供了一个叫 Dashboard 应用的控制台,可以通过控制台来动态修改规则。


控制台其实就是一个 jar 包,可以从 Sentinel 的 github 仓库上下载,或者是通过从下面这个地址获取。


链接:https://pan.baidu.com/s/1Lw8V5ab_FUq934nLWDjfaw 提取码:obr5


之后通过 java -jar 命令启动就可以了,端口默认 8080,浏览器访问 http://ip:8080/#/login 就可以登录控制台了,用户名和密码默认都是 sentinel。


此时服务要接入控制台,只需要在配置文件上加上控制台的 ip 和端口即可

spring:  cloud:    sentinel:      transport:        # 指定控制台的ip和端口        dashboard: localhost:8080
复制代码

项目刚启动的时候控制台默认是没有数据的,需要访问一下接口,之后就有了。


之后就可以看到/sayHello 这个资源,后面就可以通过页面设置规则。

核心原理

讲完 demo,接下来就来讲一讲 Sentinel 的核心原理,也就是前面提到暗流涌动的 SphU.entry(..)这行代码背后的逻辑。

Sentinel 会为每个资源创建一个处理链条,就是一个责任链,第一次访问这个资源的时候创建,之后就一直复用,所以这个处理链条每个资源有且只有一个。

SphU.entry(..)这行代码背后就会调用责任链来完成对资源的检查逻辑。

这个责任链条中每个处理节点被称为 ProcessorSlot,中文意思就是处理器槽


这个 ProcessorSlot 有很多实现,但是 Sentinel 的核心就下面这 8 个:

  • NodeSelectorSlot

  • ClusterBuilderSlot

  • LogSlot

  • StatisticSlot

  • AuthoritySlot

  • SystemSlot

  • FlowSlot

  • DegradeSlot

这些实现会通过 SPI 机制加载,然后按照一定的顺序组成一个责任链。

默认情况下,节点是按照如下的顺序进行排序的


虽然默认就 8 个,但是如果你想扩展,只要实现 ProcessorSlot,按照 SPI 的规定配置一下就行。

下面就来按照上面节点的处理顺序来好好扒一扒这 8 个 ProcessorSlot。

1、NodeSelectorSlot

这个节点的作用是来设置当前资源对应的入口统计 Node

首先什么是统计 Node?

比如就拿上面的例子来说,当/sayHello 这个资源的 qps 超过 2 的时候,要触发限流。

但是有个疑问,Sentinel 是怎么知道/sayHello 这个资源的 qps 是否达到 2 呢?

当然是需要进行数据统计的,只有通过统计,才知道 qps 是否达到 2,这个进行数据统计的类在 Sentinel 中叫做 Node。


通过 Node 这个统计的类就知道有多少请求,成功多少个,失败多少个,qps 是多少之类的。底层其实是使用到了滑动窗口算法。

那么什么叫对应的入口?

在 Sentinel 中,支持同一个资源有不同的访问入口。

举个例子,这个例子后面会反复提到。

假设把杭州看做是服务,西湖看做是一个资源,到达西湖有两种方式,地铁和公交。


所以要想访问西湖这个资源,就可以通过公交和地铁两种方式,而公交和地铁就对应前面说的入口的意思。

只不过一般一个资源就一个入口,比如一个 http 接口一般只能通过 http 访问,但是 Sentinel 支持多入口,你可以不用,但是 Sentinel 有。

所以 NodeSelectorSlot 的作用就是选择资源在当前调用入口的统计 Node,这样就实现了统计同一个资源在不同入口访问数据,用上面的例子解释,就可以实现分别统计通过公交和地铁访问西湖的人数。

资源的入口可以在进入资源之前通过 ContextUtil.enter("入口名", origin)来指定,如果不指定,那么入口名称默认就是 sentinel_default_context。

在 SpringMVC 环境底下,所有的 http 接口资源,默认的入口都是 sentinel_spring_web_context


入口名称也可以通过控制台看到


那么为什么要搞一个入口的概念呢?这里咱先留个悬念,后面再说。

2、ClusterBuilderSlot

ClusterBuilderSlot 的作用跟 NodeSelectorSlot 其实是差不多的,也是用来选择统计 Node,但是选择的 Node 的统计维护跟 NodeSelectorSlot 不一样。

ClusterBuilderSlot 会选择两个统计 Node:

  • 第一个统计 Node 是资源的所有入口的统计数据之和,就是资源访问的总数据

  • 第二个统计 Node 就是统计资源调用者对资源访问数据

资源调用者很好理解,比如一个 http 接口资源肯定会被调用,那么调用这个接口的服务或者应用其实就是资源的调用者,但是一般资源的调用者就是指某个服务,后面调用者我可能会以服务来代替。

一个接口可以被很多服务调用,所以一个资源可以很多调用者,而不同调用者都会有单独的一个统计 Node,用来分别统计不同调用者对资源的访问数据。

举个例子,现在访问西湖这个资源的大兄弟来自上海,那么就会为上海创建一个统计 Node,用来统计所有来自上海的人数,如果是北京,那么就会为北京创建一个统计 Node。

那么如何知道访问资源来自哪个服务(调用者)呢?

也是通过 ContextUtil.enter("入口名", origin)来指定,这个方法的第二个参数 origin 就是代表服务名的意思,默认是空。

所以 ContextUtil.enter(..)可以同时指定资源的入口和调用者,一个资源一定有入口,因为不指定入口默认就是 sentinel_default_context,但是调用者不指定就会没有。

对于一个 http 请求来说,Sentinel 默认服务名需要放到 S-user 这个请求头中,所以如果你想知道接口的调用服务,需要在调用方发送请求的时候将服务名设置到 S-user 请求头中。

当资源所在的服务接收到请求时,Sentinel 就会从 S-user 请求头获取到服务名,之后再通过 ContextUtil.enter("入口名", "调用者名")来设置当前资源的调用者


这里我原以为 Sentinel 会适配比如 OpenFeign 之类的框架,会自动将服务名携带到请求头中,但是我翻了一下源码,发现并没有去适配,不知道是出于什么情况的考虑。

所以这一节加上上一节,我们知道了一个资源其实有三种维度的统计 Node:

  • 分别统计不同入口的访问数据

  • 统计所有入口访问数据之和

  • 分别统计来自某个服务的访问数据

为了方便区分,我来给这三个统计 Node 取个响亮的名字

不同入口的访问数据就叫他 DefaultNode,统计所有入口访问数据之和就叫他 ClusterNode,来自某个服务的访问数据就叫他 OriginNode。

是不是够响亮!

那么他们的关系就可以用下面这个图来表示


3、LogSlot

这个 Slot 没什么好说的,通过名字可以看出来,其实就是用来打印日志的。


当发生异常,就会打印日志。

4、StatisticSlot

这个 Slot 就比较重要了,就是用来统计数据的。

前面说的 NodeSelectorSlot 和 ClusterBuilderSlot,他们的作用就是根据资源当前的入口和调用来源来选择对应的统计 Node。

而 StatisticSlot 就是对这些统计 Node 进行实际的统计,比如加一下资源的访问线程数,资源的请求数量等等。


前几个 Slot 其实都是准备、统计的作用,并没有涉及限流降级之类的,他们是为限流降级提供数据支持的。

5、AuthoritySlot

Authority 是授权的意思,这个 Slot 的作用是对资源调用者进行授权,就是黑白名单控制。

可以通过控制台来添加授权规则。


在 AuthoritySlot 中会去获取资源的调用者,之后会跟授权规则中的资源应用这个选项进行匹配,之后就会出现有以下 2 种情况:

  • 授权类型是黑名单,匹配上了,说明在黑名单内,那么这个服务就不能访问这个资源,没匹配上就可以访问

  • 授权类型是白名单。匹配上了,说明在白名单内,那么这个服务就可以访问这个资源,没匹配上就不可以访问

6、SystemSlot

这个的作用是根据整个系统运行的统计数据来限流的,防止当前系统负载过高。

它支持入口 qps、线程数、响应时间、cpu 使用率、负载 5 个限流的维度。


对于系统的入口 qps、线程数、平均响应时间这些指标,也会有一个统计 Node 专门去统计,所以这个统计 Node 的作用就好比会去统计所有访问西湖的人数,统计也在 StatisticSlot 代码中,前面说的时候我把代码隐藏了


至于 cpu 使用率、负载指标,Sentinel 会启动一个定时任务,每隔 1s 会去读取一次当前系统的 cpu 和负载。

7、FlowSlot

这个 Slot 会根据预设的规则,结合前面的统计出来的实时信息进行流量控制。

在说 FlowSlot 之前,先来用之前画的那张图回顾一下一个资源的三种统计维度


这里默默地注视 10s。。

限流规则配置项比较多


这里我们来好好扒一扒这些配置项的意思。


针对来源,来源就是前面说的调用方,这个配置表明,这个规则适用于哪个调用方,默认是 default,就是指规则适用于所有调用方,如果指定了调用方,那么这个规则仅仅对指定的调用方生效。


举个例子来说,比如说现在想限制来自上海的访问的人数,那么针对来源可以填上海,之后当访问的大兄弟来自上海的时候,Sentinel 就会根据上海对应的 OriginNode 数据来判断是否达到限流的条件。


阈值类型,就是限流条件,当资源的 qps 或者访问的线程数到达设置的单机阈值,就会触发限流。


是否集群,这个作用是用来对集群控制的,因为一个服务可能在很多台机器上,而这个的作用就是将整个集群看成一个整体来限流,这里就不做深入讨论。


流控模式,这个流控模式的选项仅仅对阈值类型为 qps 有效,当阈值类型线程数时无效。


这个配置就比较有意思了,分为直接、关联、链路三种模式。


直接模式的意思就是当资源的 ClusterNode 统计数据统计达到了阈值,就会触发限流。


比如,当通过地铁和公交访问西湖人数之和达到单机阈值之后就会触发限流。

关联模式下需要填写关联的资源名称


关联的意思就是当关联资源的 ClusterNode 统计的 qps 达到了设置的阈值时,就会触发当前资源的限流操作。


比如,假设现在西湖这个资源关联了雷峰塔这个资源,那么当访问雷峰塔的人数达到了指定的阈值之后,此时就触发西湖这个资源的限流,就是雷峰塔流量高了但是限流的是西湖。


链路模式也一样,它需要关联一个入口资源


关联入口的意思就是指,当访问资源的实际入口跟关联入口是一样的时候,就会根据这个入口对应的 DefaultNode 的统计数据来判断是否需要限流。


也就是可以单独限制通过公交和地铁的访问的人数的意思。


到这,其实前面说到的一个资源的三种统计维度的数据都用到了,现在应该明白了为什么需要这么多维度的数据,就是为不同维度限流准备的。


最后一个配置项,流控效果,这个就是如果是通过 qps 来限流,并且达到了限流的条件之后会做什么,如果是线程数,就直接抛出 BlockException 异常


也有三种方式,快速失败、Warm Up、排队等待


快速失败的意思就是指一旦触发限流了,那么直接抛出 BlockException 异常


Warm Up 的作用就是为了防止系统流量突然增加时出现瞬间把系统压垮的情况。通过"冷启动",让通过的流量缓慢增加,在一定时间内逐渐增加到阈值上限。


排队等待,很好理解,意思当出现限流了,不是抛异常,而是去排队等待一定时间,其实就是让请求均匀速度通过,内部使用的是传说中的漏桶算法。

DegradeSlot

这是整个责任链中最后一个 slot,这个 slot 的作用是用来熔断降级的。

Sentinel 支持三种熔断策略:慢调用比例、异常比例 、异常数,通过规则配置也可以看出来。


熔断器的工作流程大致如下


Sentinel 会为每个设置的规则都创建一个熔断器,熔断器有三种状态,OPEN(打开)、HALF_OPEN(半开)、CLOSED(关闭)


  • 当处于 CLOSED 状态时,可以访问资源,访问之后会进行慢调用比例、异常比例、异常数的统计,一旦达到了设置的阈值,就会将熔断器的状态设置为 OPEN

  • 当处于 OPEN 状态时,会去判断是否达到了熔断时间,如果没到,拒绝访问,如果到了,那么就将状态改成 HALF_OPEN,然后访问资源,访问之后会对访问结果进行判断,符合规则设置的要求,直接将熔断器设置为 CLOSED,关闭熔断器,不符合则还是改为 OPEN 状态

  • 当处于 HALF_OPEN 状态时,直接拒绝访问资源


一般来说,熔断降级其实是对于服务的调用方来说的。


在项目中会经常调用其它服务或者是第三方接口,而对于这些接口,一旦它们出现不稳定,就有可能导致自身服务长时间等待,从而出现响应延迟等等问题。


此时服务调用方就可基于熔断降级方式解决。


一旦第三方接口响应时间过长,那么就可以使用慢调用比例规则,当出现大量长时间响应的情况,那么就直接熔断,不去请求。


虽然说熔断降级是针对服务的调用方来说,但是 Sentinel 本身并没有限制熔断降级一定是调用其它的服务。

总结

通过整篇文章的分析之后,再回头看看 Sentinel 的简介的内容,其实就能更好地理解 Sentinel 的定位和拥有的强大功能。


Sentinel 核心就是一堆统计数据和基于这些统计数据实现的流控和熔断的功能,源码并不复杂,而且 Sentinel 的代码写得非常好。


最后奉上 Sentinel 源码注释仓库地址:

https://github.com/sanyou3/sentinel.git


还有本文 demo 代码仓库地址:


用户头像

Java你猿哥

关注

一只在编程路上渐行渐远的程序猿 2023-03-09 加入

关注我,了解更多Java、架构、Spring等知识

评论

发布
暂无评论
深扒Sentinel背后的实现原理之后,我终于明白它为什么这么强了_Java_Java你猿哥_InfoQ写作社区