微服务面试必问的 Dubbo,这么详细还怕自己找不到工作?
大家好,我是小羽。
Dubbo 起源于阿里巴巴,对于我们做电商开发的人来说,基本是首选的技术,那么为何一个区区 soa 服务治理框架,会受到这么多人的青睐呢?
今天就跟着小羽一起看看这个微服务框架之一的 Dubbo 的详细解读吧。
前言
互联网的不断发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对。
服务化的进一步发展,服务越来越多,服务之间的调用和依赖关系也越来越复杂,诞生了面向服务的架构体系(SOA),
也因此衍生出了一系列相应的技术,如对服务提供、服务调用、连接处理、通信协议、序列化方式、服务发现、服务路由、日志输出等行为进行封装的服务框架。
就这样分布式系统的服务治理框架就出现了,Dubbo 也就这样产生了。
概念
Dubbo 是一款高性能、轻量级的开源 RPC
框架、提供服务自动注册、自动发现等高效治理方案,可以和 Spring
框架无缝集成。
简单的说,dubbo 就是个分布式服务框架,在有分布式需要的时候可以使用 dubbo 的框架,使用 dubbo 的好处:
1、透明化的远程方法调用
2、软负载均衡及容错机制
3、服务自动注册与发现
4、提供了完善的服务接口管理与监控功能
编辑
架构图
RPC
简介
RPC 全称为 remote procedure call,即远程过程调用。比如两台服务器 A 和 B,A 服务器上部署一个应用,B 服务器上部署一个应用,A 服务器上的应用想调用 B 服务器上的应用提供的方法,由于两个应用不在一个内存空间,不能直接调用,所以需要通过网络来表达调用的语义和传达调用的数据。
RPC 并不是一个具体的技术,而是指整个网络远程调用过程。
RPC 是一个泛化的概念,严格来说一切远程过程调用手段都属于 RP C 范畴。各种开发语言都有自己的 RPC 框架。Java 中的 RPC 框架比较多,广泛使用的有 RMI、Hessian、Dubbo
等。
原理
服务消费方(client)调用以本地调用方式调用服务。客户端存根(client stub)接收到调用后负责将方法、参数等编码成能在网络中传输的消息体。然后,客户端存根找到服务地址后,将消息发送给服务端。
服务提供方(server)收到序列化后的消息,就按照解码该消息。然后,根据解码结果调用本地服务,执行完毕后,将结果打包发送给消费方。
服务消费方收到执行结果后,也是进行解码后得到结果。
编辑
原理
使用场景
RPC 分布式服务,拆分应用进行服务化,提高开发效率,调优性能,节省竞争资源
配置管理,解决服务的地址信息剧增,配置困难的问题
服务依赖,解决服务间依赖关系错踪复杂的问题
服务扩容,解决随着访问量的不断增大,动态扩展服务提供方的机器的问题
核心功能
Remoting
:远程通讯,提供对多种 NIO 框架抽象封装,包括“同步转异步”和“请求-响应”模式的信息交换方式。
Cluster
:服务框架,提供基于接口方法的透明远程过程调用,包括多协议支持,以及软负载均衡,失败容错,地址路由,动态配置等集群支持。
Registry
:服务注册中心,服务自动发现: 基于注册中心目录服务,使服务消费方能动态的查找服务提供方,使地址透明,使服务提供方可以平滑增加或减少机器。
核心组件
Provider:服务的提供方
Consumer:调用远程服务的服务消费方
Registry:服务注册和发现的注册中心
Monitor:统计服务调用次数和调用时间的监控中心
Container:服务运行容器
编辑
组件
服务注册与发现
流程如下:
1、Provider(提供者)绑定指定端口并启动服务
2、供者连接注册中心,并发本机 IP、端口、应用信息和提供服务信息发送至注册中心存储
3、Consumer(消费者),连接注册中心 ,并发送应用信息、所求服务信息至注册中心
4、注册中心根据消费者所求服务信息匹配对应的提供者列表发送至 Consumer 应用缓存。
5、Consumer 在发起远程调用时基于缓存的消费者列表择其一发起调用。
6、Provider 状态变更会实时通知注册中心、在由注册中心实时推送至 Consumer 设计的原因:
Consumer 与 Provider 解偶,双方都可以横向增减节点数。注册中心对本身可做对等集群,可动态增减节点,并且任意一台宕掉后,将自动切换到另一台
7、去中心化,双方不直接依懒注册中心,即使注册中心全部宕机短时间内也不会影响服务的调用
8、服务提供者无状态,任意一台宕掉后,不影响使用
编辑
流程
服务治理
治理原因
Dubbo 的服务治理主要原因:
1、过多的服务 URL 配置困难。
2、负载均衡分配节点压力过大的情况下也需要部署集群。
3、服务依赖混乱,启动顺序不清晰。
4、过多服务导致性能指标分析难度较大,需要监控。
主要特性
透明远程调用:就像调用本地方法一样调用远程方法;只需简单配置,没有任何 API 侵入
负载均衡机制:Client 端 LB,可在内网替代 F5 等硬件负载均衡器
容错重试机制:服务 Mock 数据,重试次数、超时机制等
自动注册发现:注册中心基于接口名查询服务提 供者的 IP 地址,并且能够平滑添加或删除服务提供者
性能日志监控:Monitor 统计服务的调用次调和调用时间的监控中心
服务治理中心:路由规则,动态配置,服务降级,访问控制,权重调整,负载均衡,等手动配置
自动治理中心:无,比如:熔断限流机制、自动权重调整等(因此可以搭配 SpringCloud 的熔断机制等进行开发)
编辑
服务治理
架构设计
整体架构
先看下 Dubbo 的整体架构图:
图例说明:
编辑
整体架构
图中左边淡蓝背景的为服务消费方使用的接口,右边淡绿色背景的为服务提供方使用的接口,位于中轴线上的为双方都用到的接口。
图中从下至上分为十层,各层均为单向依赖,右边的黑色箭头代表层之间的依赖关系,每一层都可以剥离上层被复用,其中,Service
和 Config
层为 API,其它各层均为 SPI。
图中绿色小块的为扩展接口,蓝色小块为实现类,图中只显示用于关联各层的实现类。
图中蓝色虚线为初始化过程,即启动时组装链,红色实线为方法调用过程,即运行时调时链,紫色三角箭头为继承,可以把子类看作父类的同一个节点,线上的文字为调用的方法。
各层说明
config 配置层:对外配置接口,以 ServiceConfig, ReferenceConfig 为中心,可以直接初始化配置类,也可以通过 spring 解析配置生成配置类
proxy 服务代理层:服务接口透明代理,生成服务的客户端 Stub 和服务器端 Skeleton,以 ServiceProxy 为中心,扩展接口为 ProxyFactory
registry 注册中心层:封装服务地址的注册与发现,以服务 URL 为中心,扩展接口为 RegistryFactory, Registry, RegistryService
cluster 路由层:封装多个提供者的路由及负载均衡,并桥接注册中心,以 Invoker 为中心,扩展接口为 Cluster, Directory, Router, LoadBalance
monitor 监控层:RPC 调用次数和调用时间监控,以 Statistics 为中心,扩展接口为 MonitorFactory, Monitor, MonitorService
protocol 远程调用层:封装 RPC 调用,以 Invocation, Result 为中心,扩展接口为 Protocol, Invoker, Exporter
exchange 信息交换层:封装请求响应模式,同步转异步,以 Request, Response 为中心,扩展接口为 Exchanger, ExchangeChannel, ExchangeClient, ExchangeServer
transport 网络传输层:抽象 mina 和 netty 为统一接口,以 Message 为中心,扩展接口为 Channel, Transporter, Client, Server, Codec
serialize 数据序列化层:可复用的一些工具,扩展接口为 Serialization, ObjectInput, ObjectOutput, ThreadPool
主要模块
dubbo-common
公共逻辑模块,包括 Util
类和通用模型。
dubbo-remoting
远程通讯模块,相当于 Dubbo 协议的实现,如果 RPC 用 RMI 协议则不需要使用此包。
dubbo-rpc
远程调用模块,抽象各种协议,以及动态代理,只包含一对一的调用,不关心集群的管理。
dubbo-cluster
集群模块,将多个服务提供方伪装为一个提供方,包括:负载均衡、容错、路由等,集群的地址列表可以是静态配置的,也可以是由注册中心下发。
dubbo-registry
注册中心模块,基于注册中心下发地址的集群方式,以及对各种注册中心的抽象。
dubbo-monitor
监控模块,统计服务调用次数,调用时间的,调用链跟踪的服务。
dubbo-config
配置模块,是 Dubbo 对外的 API ,用户通过 Config 使用 Dubbo ,隐藏 Dubbo 所有细节。
dubbo-container
容器模块,是一个 Standalone
的容器,以简单的 Main 加载 Spring 启动,因为服务通常不需要 Tomcat/JBoss 等 Web 容器的特性,没必要用 Web 容器去加载服务。
编辑
主要模块
调用方式
异步调用
基于 NIO 的非阻塞实现并行调用,客户端不需要启动多线程即可完成并行调用多个远程服务,相对多线程开销较小
编辑
异步调用
本地调用
使用了 Injvm 协议,是一个伪协议,它不开启端口,不发起远程调用,只在 JVM 内直接关联,但执行 Dubbo 的 Filter 链。
Define injvm protocol:
Set default protocol:
Set service protocol:
Use injvm first:(服务暴露与服务引用都需要声明 injvm=“true”)
容错机制
调用流程
1、Cluster 将 Directory 中的多个 Invoker 伪装成一个 Invoker,对上层透明,伪装过程包含了容错逻辑
2、Router 负责从多个 Invoker 中按路由规则选出子集,比如读写分离,应用隔离等
3、LoadBalance 负责从多个 Invoker 中选出具体的一个用于本次调用,选的过程包含了负载均衡算法
编辑
调用流程
容错策略
Dubbo 官网提出总共有六种容错策略
1、Failover Cluster
失败自动切换,当出现失败,重试其它服务器。(默认)
2、Failfast Cluster
快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。
3、Failsafe Cluster
失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。
4、Failback Cluster
失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。
5、Forking Cluster
并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。可通过 forks=”2”来设置最大并行数。
6、Broadcast Cluster
广播调用所有提供者,逐个调用,任意一台报错则报错。(2.1.0 开始支持) 通常用于通知所有提供者更新缓存或日志等本地资源信息。
总结:在实际应用中查询语句容错策略建议使用默认 Failover Cluster
,而增删改建议使用 Failfast Cluster
或者使用 Failover Cluster
(retries=”0”)策略,防止出现数据重复添加等等其它问题!建议在设计接口时候把查询接口方法单独做一个接口提供查询。
连接方式
Dubbo 的客户端和服务端有三种连接方式,分别是:广播、直连和使用Zookeeper
注册中心。
Dubbo 广播
这种方式是 dubbo 官方入门程序所使用的连接方式,但是这种方式有很多问题,在企业开发中不使用广播的方式。
服务端配置:
客户端配置:
Dubbo 直连
这种方式在企业中一般在开发中环境中使用,但是生产环境很少使用,因为服务是直接调用,没有使用注册中心,很难对服务进行管理。Dubbo 直连,首先要取消广播,然后客户端直接到指定需要的服务的 url 获取服务即可。
服务端配置:
客户端配置:
zookeeper 注册中心
Dubbo 注册中心和广播注册中心配置类似,不过需要指定注册中心类型和注册中心地址,这个时候就不是把服务信息进行广播了,而是告诉给注册中心进行管理,这个时候我们就需要有一个注册中心,官方推荐使用 zookeeper 作为注册中心。
编辑
Zookeeper 注册中心
注册中心负责服务地址的注册与查找,相当于目录服务,服务提供者在启动时与注册中心交互,消费者不断的发起请求获取服务信息,注册中心不转发请求,压力较小
服务端配置:
客户端配置:
策略
负载均衡策略
1、Random LoadBalance,随机(默认的负载均衡策略)
RandomLoadBalance 是加权随机算法的具体实现,可以完全随机,也可以按权重设置随机概率。
2、RoundRobin LoadBalance,轮循
可以轮询和加权轮询。存在响应慢的提供者会累积请求的问题,比如:第二台机器很慢,但没挂,当请求调到第二台时就卡在那,久而久之,所有请求都卡在调到第二台上。
3、LeastActive LoadBalance,最少活跃调用数
活跃调用数越小,表明该服务提供者效率越高,单位时间内可处理更多的请求。此时应优先将请求分配给该服务提供者。
4、ConsistentHash LoadBalance,一致性 Hash
一致性 Hash 算法,相同参数的请求一定分发到一个 provider 上去。provider 挂掉的时候,会基于虚拟节点均匀分配剩余的流量,抖动不会太大。
集群容错策略
1、failover cluster(默认)
失败自动切换,调用失败时,自动重试其他机器。通常用于读操作,但重试会带来更长延迟。
2、Failfast Cluster 快速失败,只发起一次调用,失败立即报错。通常用于非幂等性的写操作,比如新增记录。
3、Failsafe Cluster 失败安全,出现异常时,直接忽略。通常用于写入审计日志等操作。
4、Failback Cluster 失败自动恢复,后台记录失败请求,定时重发。通常用于消息通知操作。
5、Forking Cluster 并行调用多个服务器,只要一个成功即返回。通常用于实时性要求较高的读操作,但需要浪费更多服务资源。
动态代理策略
默认使用 javassist
动态字节码生成,创建代理类。也可以通过 spi 扩展机制配置自己的动态代理策略。
集群容错方案
配置说明,方案配置方式,优先使用消费端配置
尽量在只在服务端进行配置
cluster 类型均为小写
默认为 FailoverCluster 失败切换方案
集群容错方案 support
FailoverCluster(默认):失败切换
场景:调用失败后切换其他服务
配置:
代码实现逻辑:
1. 根据负载均衡策略选出需要调用的服务实例,排除已调用的
2. 执行选出的实例,并将其保存到已调用列表中
3. 执行实例成功即返回
4. 执行实例不成功,为到最大重试次数则执行第一步,否则抛出 RpcException 异常
FailbackCluster:失败重试
场景:调用失败时记录失败请求,定时重发
配置:
代码实现逻辑
1. 根据负载均衡策略选出需要调用的服务实例
2. 执行选出的实例
3. 执行实例成功即返回
4. 执行异常则创建延时 5 秒的定时任务,并加入时间轮定时器,第一次需要进行定时器初始化,分为 32 个时间片,每 1 秒滚动一次,最大挂起任务默认 100 个,超出最大任务数时抛出 RejectedExecutionException 异常。
5. 重试执行定时任务,次数超出最大执行次数停止,并输出 error 日志,默认为 3 次。
FailfastCluster:快速失败
场景:调用失败立即报错
配置:
代码实现逻辑
1. 根据负载均衡策略选出需要调用的服务实例
2. 执行选出的实例
3. 执行实例成功即返回,失败抛出 RpcException 异常
FailsafeCluster:安全失败
场景:调用失败后忽略
配置:
代码实现逻辑
1. 根据负载均衡策略选出需要调用的服务实例
2. 执行选出的实例
3. 执行实例成功即返回,失败输出 error 日志,并返 RpcResult,视为忽略。
ForkingCluster:并发处理
场景:并发调用指定数量的服务,一个成功则返回,对实时性要求高的场景,要求快速返回,需要使用更多服务器资源。
配置:
代码实现逻辑
1. 根据负载均衡策略选出几个不同的服务实例
2. 并发执行选出的几个实例,并将返回结果放入堵塞队列中
3. 返回堵塞队列中的第一个值,如规定时间内未获取到队列中的值或获取到异常值则返回 RPC 异常。
BroadcastCluster:广播
场景:广播方式逐个调用服务提供者,有一个报错则返回错误,多用于通知服务提供者更新本地资源信息,如缓存,日志等。
配置:
代码实现逻辑
1. 循环逐个执行所有服务实例信息
2. 保存一份返回结果和异常信息
3. 执行完全部实例后,如异常信息不为空,则抛出异常信息,否则返回最后一个实例的结果。
AvailableCluster:可用服务
场景:调用第一个可用服务
配置:
代码实现逻辑
1. 循环所有服务实例信息
2. 执行第一个可用的实例,并返回结果
3. 如无可用实例则返回 RpcException 异常
MergeableCluster:合并处理
场景:返回合并或叠加处理结果
配置:
代码实现逻辑
1. 判断 merger,为空、null、0、false、N/A 是执行第一个可用服务并返回结果,无可用则执行第一个实例,并返回结果。
2. 获取方法实例的返回类型
3. 异步调用所有实例,并将异步结果 Result 存储到结果集中,返回异常输出 error 日志
4. 结果集为空返回 RpcException,大小为 1 时返回第一个 Result
5. 当 merger 的第一个字符为“.”时,判断当 merger 实例返回类型不为 void,且返回类型必须是结果集中第一个返回类型的父类型或相同类型时,循环执行 merger 实例,每一次都传入上一次的返回结果,最终返回获取最后一次结果,非上述情况时循环执行 merger 实例,返回结果集中的第一个结果。
6. 当 merger 为 true 或 default 时使用 Dubbo 默认合并器,否则使用自定义 merger 合并器,合并后返回
RegistryAwareCluster:默认标识、注册标识
场景:调用注册默认标识的服务
配置:
代码实现逻辑
1.8 循环所有服务实例信息
2. 执行第一个可用的实例且 default 为 true 的实例
3. 无默认实例则执行第一个可用的实例
4. 无可用的实例则抛出 RpcException 异常
主要配置
配置应用信息:
配置注册中心相关信息:
配置服务协议:
配置所有暴露服务缺省值:
配置暴露服务:
配置所有引用服务缺省值:
注解配置:
超时设置
Dubbo 消费端
全局超时配置
指定接口以及特定方法超时配置
Dubbo 服务端
全局超时配置
指定接口以及特定方法超时配置
支持协议
1、Dubbo 协议(官方推荐协议)
优点:采用 NIO 复用单一长连接,并使用线程池并发处理请求,减少握手和加大并发效率,性能较好(推荐使用)
缺点:大文件上传时,可能出现问题(不使用 Dubbo 文件上传)
2、RMI(Remote Method Invocation)协议
优点:JDK 自带的能力。可与原生 RMI 互操作,基于 TCP 协议
缺点:偶尔连接失败.
3、Hessian 协议
优点:可与原生 Hessian 互操作,基于 HTTP 协议
缺点:需 hessian.jar 支持,http 短连接的*开销大 8
常用设计模式
Dubbo 框架在初始化和通信过程中使用了多种设计模式,可灵活控制类加载、权限控制等功能。
工厂模式
Provider 在 export 服务时,会调用 ServiceConfig 的 export 方法。ServiceConfig 中有个字段:
Dubbo 里有很多这种代码。这也是一种工厂模式,只是实现类的获取采用了 JDK SPI 的机制。这么实现的优点是可扩展性强,想要扩展实现,只需要在 classpath 下增加个文件就可以了,代码零侵入。另外,像上面的 Adaptive 实现,可以做到调用时动态决定调用哪个实现,但是由于这种实现采用了动态代理,会造成代码调试比较麻烦,需要分析出实际调用的实现类。
装饰器模式
Dubbo 在启动和调用阶段都大量使用了装饰器模式。以 Provider 提供的调用链为例,具体的调用链代码是在 ProtocolFilterWrapper 的 buildInvokerChain 完成的,具体是将注解中含有 group=provider 的 Filter 实现,按照 order 排序,最后的调用顺序是:
更确切地说,这里是装饰器和责任链模式的混合使用。例如,EchoFilter 的作用是判断是否是回声测试请求,是的话直接返回内容,这是一种责任链的体现。而像 ClassLoaderFilter 则只是在主功能上添加了功能,更改当前线程的 ClassLoader,这是典型的装饰器模式。
观察者模式
Dubbo 的 Provider 启动时,需要与注册中心交互,先注册自己的服务,再订阅自己的服务,订阅时,采用了观察者模式,开启一个 listener。注册中心会每 5 秒定时检查是否有服务更新,如果有更新,向该服务的提供者发送一个 notify 消息,provider 接受到 notify 消息后,即运行 NotifyListener 的 notify 方法,执行监听器方法。
动态代理模式
Dubbo 扩展 JDK SPI 的类 ExtensionLoader 的 Adaptive 实现是典型的动态代理实现。Dubbo 需要灵活地控制实现类,即在调用阶段动态地根据参数决定调用哪个实现类,所以采用先生成代理类的方法,能够做到灵活的调用。生成代理类的代码是 ExtensionLoader 的 createAdaptiveExtensionClassCode 方法。代理类的主要逻辑是,获取 URL 参数中指定参数的值作为获取实现类的 key
工作流程
整体流程:
第一步:provider 向注册中心去注册
第二步:consumer 从注册中心订阅服务,注册中心会通知 consumer 注册好的服务
第三步:consumer 调用 provider
第四步:consumer 和 provider 都异步通知监控中心
编辑
流程图
总结
最后用一张图来形象的模拟 Dubbo 的使用:
编辑
使用
以上只是我总结的一些关于 dubbo 最基础的原理及使用介绍,至于代码编写过程的 bug 处理经验,环境搭建、项目布局等等问题,需要我们在平时开发中,将系统知识与实战经验相结合去总结,这样才能真正的去掌握这项技术点。
Dubbo 目前是我用到过的最多的分布式框架,写出来的内容也是最多的,不过由于 Dubbo 用的太多,而 SpringCloud 难度比 Dubbo 要小很多,现在大部分项目都即将开始转投到了 SpringCloud 上面,后面也会出更多的 SpringCloud 相关的文章。
版权声明: 本文为 InfoQ 作者【浅羽技术】的原创文章。
原文链接:【http://xie.infoq.cn/article/65435f97e72083285183635dc】。文章转载请联系作者。
评论