一文带你了解 J.U.C 的 FutureTask、Fork/Join 框架和 BlockingQueue
本文分享自华为云社区《【高并发】J.U.C组件扩展》,作者: 冰 河 。
FutureTask
FutureTask 是 J.U.C(java.util.concurrent)下的,但不是 AQS(AbstractQueuedSynchronizer)的子类。其对线程结果的处理值得借鉴和在项目中使用。
Thread 和 Runnable 执行完任务无法获取执行结果。Java1.5 开始提供了 Callable 和 Future,通过它们可以在任务执行完毕之后,得到任务执行的结果。
Callable 与 Runnable 接口对比
Callable:泛型接口,提供一个 call()方法,支持抛出异常,并且执行后有返回值
Runnable:接口,提供一个 run()方法,不支持抛出异常,执行后无返回值
Future 接口
对于具体的 Callable 和 Runnable 任务,可以进行取消,查询任务是否被取消,查询是否完成以及获取结果等。
Future 可以监视目标线程调用 call()的情况,当调用 Future 的 get()方法时,就可以获得结果。此时,执行任务的线程可能不会直接完成,当前线程就开始阻塞,直到 call()方法结束返回结果,当前线程才会继续执行。总之,Future 可以得到别的线程任务方法的返回值。
FutureTask 类
实现的接口为 RunnableFuture,而 RunnableFuture 接口继承了 Runnable 和 Future 两个接口,所以 FutureTask 类最终也是执行 Callable 类型的任务。如果 FutureTask 类的构造方法参数是 Runnable 的话,会转换成 Callable 类型。
FutureTask 类实现了两个接口:Runnable 和 Future。所以,它即可以作为 Runnable 被线程执行,又可以作为 Future 得到 Callable 的返回值,这样设计的好处如下:
假设有一个很费时的逻辑,需要计算并且返回这个值,同时,这个值又不是马上需要,则可以使用 Runnable 和 Future 的组合,用另外一个线程去计算返回值,而当前线程在使用这个返回值之前,可以做其他的操作,等到需要这个返回值时,再通过 Future 得到。
Future 示例代码如下:
FutureTask 示例代码如下:
Fork/Join 框架
位于 J.U.C(java.util.concurrent)中,是 Java7 中提供的用于执行并行任务的框架,其可以将大任务分割成若干个小任务,最终汇总每个小任务的结果后得到最终结果。基本思想和 Hadoop 的 MapReduce 思想类似。
主要采用的是工作窃取算法(某个线程从其他队列里窃取任务来执行),并行分治计算中的一种 Work-stealing 策略
为什么需要使用工作窃取算法呢?
假如我们需要做一个比较大的任务,我们可以把这个任务分割为若干互不依赖的子任务,为了减少线程间的竞争,于是把这些子任务分别放到不同的队列里,并为每个队列创建一个单独的线程来执行队列里的任务,线程和队列一一对应,比如 A 线程负责处理 A 队列里的任务。但是有的线程会先把自己队列里的任务干完,而其他线程对应的队列里还有任务等待处理。干完活的线程与其等着,不如去帮其他线程干活,于是它就去其他线程的队列里窃取一个任务来执行。而在这时它们会访问同一个队列,所以为了减少窃取任务线程和被窃取任务线程之间的竞争,通常会使用双端队列,被窃取任务线程永远从双端队列的头部拿任务执行,而窃取任务的线程永远从双端队列的尾部拿任务执行。
工作窃取算法的优点:
充分利用线程进行并行计算,并减少了线程间的竞争
工作窃取算法的缺点:
在某些情况下还是存在竞争,比如双端队列里只有一个任务时。并且该算法会消耗更多的系统资源,比如创建多个线程和多个双端队列。
对于 Fork/Join 框架而言,当一个任务正在等待它使用 Join 操作创建的子任务结束时,执行这个任务的工作线程查找其他未被执行的任务,并开始执行这些未被执行的任务,通过这种方式,线程充分利用它们的运行时间来提高应用程序的性能。为了实现这个目标,Fork/Join 框架执行的任务有一些局限性。
Fork/Join 框架局限性:
(1)任务只能使用 Fork 和 Join 操作来进行同步机制,如果使用了其他同步机制,则在同步操作时,工作线程就不能执行其他任务了。比如,在 Fork/Join 框架中,使任务进行了睡眠,那么,在睡眠期间内,正在执行这个任务的工作线程将不会执行其他任务了。
(2)在 Fork/Join 框架中,所拆分的任务不应该去执行 IO 操作,比如:读写数据文件
(3)任务不能抛出检查异常,必须通过必要的代码来出来这些异常
Fork/Join 框架的核心类
Fork/Join 框架的核心是两个类:ForkJoinPool 和 ForkJoinTask。ForkJoinPool 负责实现工作窃取算法、管理工作线程、提供关于任务的状态以及执行信息。ForkJoinTask 主要提供在任务中执行 Fork 和 Join 操作的机制。
示例代码如下:
BlockingQueue
阻塞队列,是线程安全的。
被阻塞的情况如下:
(1)当队列满时,进行入队列操作
(2)当队列空时,进行出队列操作
使用场景如下:
主要在生产者和消费者场景
BlockingQueue 的方法
BlockingQueue 具有 4 组不同的方法用于插入、移除以及对队列中的元素进行检查。如果请求的操作不能得到立即执行的话,每个方法的表现也不同。这些方法如下:
四组不同的行为方式解释:
抛出异常
如果试图的操作无法立即执行,抛一个异常。
特殊值
如果试图的操作无法立即执行,返回一个特定的值(常常是 true / false)。
阻塞
如果试图的操作无法立即执行,该方法调用将会发生阻塞,直到能够执行。
超时
如果试图的操作无法立即执行,该方法调用将会发生阻塞,直到能够执行,但等待时间不会超过给定值。返回一个特定值以告知该操作是否成功(典型的是 true / false)。
BlockingQueue 的实现类如下:
ArrayBlockingQueue:有界的阻塞队列(容量有限,必须在初始化的时候指定容量大小,容量大小指定后就不能再变化),内部实现是一个数组,以 FIFO 的方式存储数据,最新插入的对象是尾部,最新移除的对象是头部。
DelayQueue:阻塞的是内部元素,DelayQueue 中的元素必须实现一个接口——Delayed(存在于 J.U.C 下)。Delayed 接口继承了 Comparable 接口,这是因为 Delayed 接口中的元素需要进行排序,一般情况下,都是按照 Delayed 接口中的元素过期时间的优先级进行排序。应用场景主要有:定时关闭连接、缓存对象、超时处理等。内部实现使用 PriorityQueue 和 ReentrantLock。
LinkedBlockingQueue:大小配置是可选的,如果初始化时指定了大小,则是有边界的;如果初始化时未指定大小,则是无边界的(其实默认大小是 Integer 类型的最大值)。内部实现时一个链表,以 FIFO 的方式存储数据,最新插入的对象是尾部,最新移除的对象是头部。
PriorityBlockingQueue:带优先级的阻塞队列,无边界,但是有排序规则,允许插入空对象(也就是 null)。所有插入的对象必须实现 Comparable 接口,队列优先级的排序规则就是按照对 Comparable 接口的实现来定义的。可以从 PriorityBlockingQueue 中获得一个迭代器 Iterator,但这个迭代器并不保证按照优先级的顺序进行迭代。
SynchronousQueue:队列内部仅允许容纳一个元素,当一个线程插入一个元素后,就会被阻塞,除非这个元素被另一个线程消费。因此,也称 SynchronousQueue 为同步队列。SynchronousQueue 是一个无界非缓存的队列。准确的说,它不存储元素,放入元素只有等待取走元素之后,才能再次放入元素
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/d3e0801210474b090727bbae2】。文章转载请联系作者。
评论