CompletableFuture 原理及应用场景详解

1.应用场景
现在我们打开各个 APP 上的一个页面,可能就需要涉及后端几十个服务的 API 调用,比如某宝、某个外卖 APP 上,下面是某个外卖 APP 的首页。首页上的页面展示会关联很多服务的 API 调用,如果使用同步调用的方式,接口耗时完全不能满足需求,因此,需要用到异步调用的方式。

2.使用线程池的弊端
说起异步调用,我们通常是创建一个线程池来实现多个请求的并行调用,这样接口的整体耗时由执行时间最长的线程决定。

但是线程池存在的问题是资源利用率较低:
CPU 资源大量浪费在阻塞等待上
CPU 调度的线程数增加了,在上下文切换上的资源消耗更大了。而且线程本身也占用系统资源
3.CompletableFuture 的特性
我们引入 CompletableFuture 对业务流程进行编排,降低依赖之间的阻塞。本文主要讲述 CompletableFuture 的使用和原理。并对比 Future、CompletableFuture、RxJava、Reactor 的特性
可组合:将多个依赖操作通过不同方式进行编排,例如 CompletableFuture 提供 thenCompose、thenCombine 等方法,这些方法支持了可组合的特性
操作融合:将数据流中的多个操作符以某种方式结合起来,进而降低开销
延迟执行:操作不会立即执行,当收到明确指示时才会触发操作
回压:异步阶段的处理速度跟不上,直接失败会导致大量数据丢失,这是需要反馈上游生产者降低调用量
RxJava 和 Reactor 虽然功能更强大,但是学习成本也更高,我们选择学习成本较低的 CompletableFuture
4 一个例子回顾 Future
CompletableFuture 是由 Java 8 引入的,在 Java8 之前我们一般通过 Future 实现异步,而 Future 是 Java5 新加的接口,提供异步并行计算的功能
Future 只能通过阻塞或者轮询的方式获取结果,且不支持设置回调方法
Future.get()方法是阻塞调用获取结果,还提供了 isDone 方法,在程序中轮询这个方法可查询执行结果
创建任务方法类
创建 Future 测试
最后执行结果为:
使用 Future 后任务的整体耗时,由最长的任务耗时决定
前面也说过,Future 对结果的获取不友好,没有提供回调方法,只能阻塞或者轮询的方式。
Java8 之前也可以用 guava 的 ListenableFuture,来设置回调,但是这样又会导致臭名昭著的回调地狱(异步编程中因多层嵌套回调函数导致的代码可读性、可维护性急剧下降的现象),这里不展开了
5.CompletableFuture 的使用
CompletableFuture 实现了两个接口:Future 和 CompletionStage,Future 用于异步计算,CompletionStage 用于表示异步执行过程汇总的一个步骤 Stage

5.1 一个例子入门 CompletableFuture
这里创建一个流程,多个任务之间存在依赖关系
根据依赖数量,可以分为:零依赖、一元依赖、二元依赖、多元依赖

5.1.1 零依赖:创建异步任务

上面两个任务 CF1、CF2 就是零依赖,可以直接创建,主要有三种创建方式:
5.1.2 一元依赖:依赖一个 CF
任务的执行存在一个上游依赖,可以通过 thenApply、thenAccept、thenCompose 方法来实现

5.1.3 二元依赖:依赖两个 CF
上图中的 CF4 就是个二元依赖,它依赖 CF1 和 CF2,我们通过 thenCombine 等回调来实现。代码如下:
5.1.4 多元依赖:依赖多个 CF

CF6 是多元依赖,这种关系可以通过allOf
、anyOf
方法来实现:
allOf
方法:多个依赖需全部完成anyOf
方法:任意一个依赖完成即可
6.CompletableFuture 原理
CompletableFuture 包含了两个 volatile 修饰的变量:result 和 stack
result 存储当前 CF 的结果
stack 表示当前 CF 完成后需要触发的依赖动作,依赖动作可以有多个,以栈形成存储,stack 表示栈顶元素
Completion 类本身是观察者的基类

被观察者:每个 CF 都是一个被观察者,stack 中存储的是注册的所有观察者,当 CF 执行完成后,会弹栈 stack,依次通知观察者。result 用于存储 CF 执行的结果数据
观察者:回调方法如 thenApply、thenAccept 会生成一个 Completion 类型的对象,就是观察者。检查当前 CF 是否已完成,如果已完成则执行 Completion,否则加入观察者链 stack 中
7.使用问题
7.1 代码执行在哪个线程上?
CompletableFuture 的组合操作都有同步和异步两种方法:
同步方法(即不带 Async 后缀的):
如果注册时被依赖的操作已经执行完成,则直接由当前线程执行
如果注册时被依赖操作未执行完,则由回调线程执行
异步方法(带 Async 后缀的):
不传递线程池参数 Executor 时,由公共线程池 CommonPool(CPU 核数-1)执行
传递时用的传入的指定线程池
7.2 异步回调要传线程池
异步回调时强制传入线程池,并根据实际情况做线程池隔离
不传递时,使用的都是公共线程池 CommonPool,容易形成性能瓶颈。手动传递线程池参数可以更方便调节参数,并给不同业务分配不同线程池,做到资源隔离
7.3 Future 需要获取返回值,才能获取异常信息
Future 需要获取返回值时,才能获取到异常信息,不加 get()方法是看不到的。
CompletableFuture 还提供了异常捕获回调 exceptionally 方法,相当于同步调用中的 try/catch 方法可获取异常
版权声明: 本文为 InfoQ 作者【卷福同学】的原创文章。
原文链接:【http://xie.infoq.cn/article/65b1ed8fd3d0070e20d6174b6】。文章转载请联系作者。
评论