写点什么

万字长文,肝了一下午的线程池详解!

发布于: 2021 年 03 月 11 日
万字长文,肝了一下午的线程池详解!

欢迎来到狗哥多线程系列连载。本篇是线程相关的第六篇,前五篇分别是:


创建线程到底有几种方式?


线程有多少种状态?Runnable 一定在执行任务吗?


万字长文,Thread 类源码解析!


wait、notify/notifyAll 解析


线程之生产者消费者模式


什么是线程池?


线程池是一种池化技术,简单来说就是一个管理线程的池子。这个池子里面的线程数是固定的,当任务数量大于线程数量时,会对线程进行复用。一个线程执行完任务,就回到这等待下一个任务的招唤,也不要你销毁。类似的还有我们工作常接触的数据库连接池。java 中的线程池主要是 juc (java.util.concurrent)包来复制,主要是由 ThreadPoolExecutor 和 ScheduledThreadPoolExecutor 类来实现,后者在前者的基础上增加了定时执行的功能。


为什么使用线程池?


那为什么要使用线程池呢?手动创建不香吗?真的不香,手动创建的情景仅仅适合很少任务量的情况。比如:只有一个任务,这问题不大。


public class OneTask {
public static void main(String[] args) { Thread thread0 = new Thread(new Task()); thread0.start(); }
static class Task implements Runnable {
public void run() { System.out.println("Thread Name: " + Thread.currentThread().getName()); } } }
复制代码


那如果我就是有 10000 个任务呢?要这样写吗?


public class OneTask {
public static void main(String[] args) { for (int i = 0; i < 10000; i++) { Thread thread0 = new Thread(new Task()); thread0.start(); } }
static class Task implements Runnable {
public void run() { System.out.println("Thread Name: " + Thread.currentThread().getName()); } }
}
复制代码


运行结果:


Thread Name: Thread-9977Thread Name: Thread-9975Thread Name: Thread-9973Thread Name: Thread-9951Thread Name: Thread-9999
复制代码


Excuse me? 创建 10000 个线程?疯了吧?java 是一门高级语言,很多底层的工作对我们来说都是黑盒,比如垃圾自动回收。每一个线程从创建到销毁都要占用资源,用完需要回收的


10000 个线程造成的垃圾回收开销得有多大呀,如果还是需要耗费一定时间的任务呢?要是我的线程任务很简单就是打印个日志,使用线程的内存开销比任务执行本身的开销还要大,这时就会得不偿失。


简而言之,频繁创建线程带来两点很不友好的问题:


  • 反复创建线程系统开销比较大,每个线程创建和销毁都需要时间。

  • 过多的线程会占用过多的内存等资源,还会带来过多的上下文切换,同时还会导致系统不稳定。


但我的任务确实多,咋办?这个时候线程池就出现了,它的出现解决了以上两点问题。


首先,针对反复创建线程开销大的问题,线程池用固定数量的线程保持工作状态并复用


其次,针对过多线程占用太多内存资源的问题,线程池根据需要创建线程,控制线程的总数量,避免占用过多内存资源


java 的线程池


线程池嘛,就是个池子。这里面的线程是固定的且可控的,java 提供了 Executor 接口方便我们实现线程池,它的继承关系是这样的:



其中 ThreadPoolExecutor 和 ScheduledThreadPoolExecutor 是实现线程池的两个类,区别上文说过了。


另外,还有个 JDK1.7 才出现的线程池:ForkJoinPool,它适合执行可产生子任务的任务,第一步是拆分也就是 Fork,第二步是汇总也就是 Join。继承关系是这样的(后面再单独出一期专门研究这个线程池)。



线程池的执行流程



1、首先提交任务,检查核心线程池是否已满?满了丢进队列。未满则创建线程执行任务。

2、队列是否已满?满了检查整个线程池是否已满?未满则是添加到队列中排队等待。

3、整个线程池都没可用线程了,直接根据拒绝策略处理新任务。

线程池的参数


找到 ThreadPoolExecutor 的构造方法:


public ThreadPoolExecutor(int corePoolSize,    int maximumPoolSize,    long keepAliveTime,    TimeUnit unit,    BlockingQueue < Runnable > workQueue,    ThreadFactory threadFactory,    RejectedExecutionHandler handler) {}
复制代码


它一共有如下 7 个参数:



ThreadPoolExecutor 构造传入这 7 个参数,就可以创建一个线程池了,下面逐一解释:


1、corePoolSize 是核心线程数,就是指定线程池有多少始终活跃的线程,这个是根据业务需求定的,线程池执行过程的第一步就是检查核心线程数是不是都已经满了。


2、maximumPoolSize 是整个线程池的最大线程数,超出核心线程的部分有空闲,是可以进行回收的。所以正常情况下,线程池中的线程数量会处在 corePoolSize 与 maximumPoolSize 的闭区间内。


二者区别


maximumPoolSize 包含 corePoolSize 和 maximumPoolSize 减 corePoolSize。他两就像长工和临时工的区别。打个比方外包公司接到大项目,需要 100 个程序员才能搞定,可公司内部就只有 10 个猿。咋办?招 90 个临时的呗,干完活就开掉。原有的 10 个就是长工对应 corePoolSize ,即使没这项目他在公司还有活干。而剩下就 90 个就是临时的,对应 maximumPoolSize - corePoolSize,做完项目就不需要了。残酷吧?


所以,maximumPoolSize = corePoolSize + 临时工


3、keepAliveTime + 时间单位用于定义核心线程以外的线程(临时工,如果有的话)的存活时间,也就是说,这是定义临时工能活多久的参数。


4、ThreadFactory 是线程工厂,用于创建线程。有默认的,也可自定义实现。


5、workQueue 是阻塞队列,也就是暂时存任务的地方。


6、Handler 是拒绝策略,后面专门有一篇文章来探讨。


了解了这 7 个参数,现在我们设定 corePoolSize = 5,maximumPoolSize = 10,阻塞队列长度 = 100。再来看一个动图,你对上面的流程图的理解会更深



有哪 6 种线程池,如何使用?


除了自定义,良心的 java 给我们实现了 3 类,6 个线程池,分别是:


由 ThreadPoolExecutor 创建

  • FixedThreadPool

  • CachedThreadPool

  • SingleThreadExecutor


由 ScheduledThreadPoolExecutor 创建

  • ScheduledThreadPool

  • SingleThreadScheduledExecutor


JDk 1.7 出现

  • ForkJoinPool (原理较复杂,后面再讲)


FixedThreadPool(固定数目的线程池)


public static ExecutorService newFixedThreadPool(int nThreads) {        return new ThreadPoolExecutor(nThreads, nThreads,                                      0L, TimeUnit.MILLISECONDS,                                      new LinkedBlockingQueue<Runnable>());}
复制代码


  • 固定线程数的线程池,核心线程数与最大线程数一样。

  • 即使任务数 > 核心线程数,也不会再创建线程,而是扔到队列等待。

  • 队列也满了,那就走拒绝策略。

  • 线程闲置,马上回收。


线程数量固定,比较适用于耗时较长的任务。避免频繁回收和分配线程


执行过程:线程池有 t0 ~ t9 十个线程,他们不断执行任务,期间任务不会减少不会增加,因为核心线程数 = 最大线程数



用法:用它生成 10 个线程,来执行 10000 个任务:


public class MyThreadPoolTest {
public static void main(String[] args) { ExecutorService executorService = Executors.newFixedThreadPool(10); for (int i = 0; i < 10000; i++) { executorService.execute(new Thread(new Task())); } executorService.shutdown(); }
static class Task implements Runnable {
public void run() { System.out.println("Thread Name: " + Thread.currentThread().getName()); }
}}
复制代码


执行结果:可以看到来来去去都是 1~10 这几个线程在跑任务,并没有编号为 11 的线程。


Thread Name: pool-1-thread-1Thread Name: pool-1-thread-2Thread Name: pool-1-thread-6Thread Name: pool-1-thread-8Thread Name: pool-1-thread-7Thread Name: pool-1-thread-7Thread Name: pool-1-thread-1Thread Name: pool-1-thread-2Thread Name: pool-1-thread-6Thread Name: pool-1-thread-10Thread Name: pool-1-thread-3
复制代码


CachedThreadPool(可缓存线程的线程池)


上源码:


public static ExecutorService newCachedThreadPool() {        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,                                      60L, TimeUnit.SECONDS,                                      new SynchronousQueue<Runnable>());    }
复制代码


  • 核心线程数 = 0,要是一直没任务线程数就 = 0。

  • 最大线程数是无限增加的(最大可到 Integer.MAX_VALUE,为 2^31-1,基本不可能达到)。

  • 线程数并非固定不变,默认闲置线程超过 60s 没工作,则销毁。

  • 队列是 SynchronousQueue 容量是 0,不存储任务,只做中转。


适用于耗时较短的任务、任务处理速度 > 任务提交速度。就不会造成不断创建新线程


用法:用它提交 10000 个任务,并执行。


public class MyThreadPoolTest {
public static void main(String[] args) { ExecutorService executorService = Executors.newCachedThreadPool(); for (int i = 0; i < 10000; i++) { executorService.execute(new Thread(new Task())); } executorService.shutdown(); }
static class Task implements Runnable {
public void run() { System.out.println("Thread Name: " + Thread.currentThread().getName()); }
}}
复制代码


执行结果:只要有任务提交就新建线程执行


Thread Name: pool-1-thread-826Thread Name: pool-1-thread-827Thread Name: pool-1-thread-233Thread Name: pool-1-thread-303Thread Name: pool-1-thread-321Thread Name: pool-1-thread-833Thread Name: pool-1-thread-825Thread Name: pool-1-thread-832Thread Name: pool-1-thread-69Thread Name: pool-1-thread-18Thread Name: pool-1-thread-830Thread Name: pool-1-thread-829
复制代码


SingleThreadExecutor(单线程的线程池)


源码:


public static ExecutorService newSingleThreadExecutor() {        return new FinalizableDelegatedExecutorService            (new ThreadPoolExecutor(1, 1,                                    0L, TimeUnit.MILLISECONDS,                                    new LinkedBlockingQueue<Runnable>()));    }
复制代码


  • 最大线程数和核心线程都 = 1,有且只有一个线程。


这货有啥使用场景?还真有,比如:用于所有任务都需要按被提交的顺序依次执行的场景


用法:


public class MyThreadPoolTest {
public static void main(String[] args) { ExecutorService executorService = Executors.newSingleThreadExecutor(); for (int i = 0; i < 10000; i++) { executorService.execute(new Thread(new Task())); } executorService.shutdown(); }
static class Task implements Runnable {
public void run() { System.out.println("Thread Name: " + Thread.currentThread().getName()); }
}}
复制代码


结果:


Thread Name: pool-1-thread-1Thread Name: pool-1-thread-1Thread Name: pool-1-thread-1Thread Name: pool-1-thread-1Thread Name: pool-1-thread-1···
复制代码


ScheduledThreadPool(定时或周期的线程池)


源码:


public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) {    return new ScheduledThreadPoolExecutor(corePoolSize);}
public ScheduledThreadPoolExecutor(int corePoolSize) { super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS, new DelayedWorkQueue());}
复制代码


适用场景:定时或周期性执行任务,它有三个重要的方法:


ScheduledExecutorService service = Executors.newScheduledThreadPool(10);
// 延迟指定时间后执行一次任务(这里是 10s 后执行完任务,结束)service.schedule(new Task(), 10, TimeUnit.SECONDS);
// 以固定的频率执行任务(表示第一次延时后每次延时多长时间执行一次),第二个参数是第一次延迟的时间,第三个参数是周期service.scheduleAtFixedRate(new Task(), 10, 10, TimeUnit.SECONDS);
// 类似于第二个,区别在于周期的定义。第二个方法的周期是以任务开始时间为起始时间计时,而这个是以任务结束的时间为起始时间service.scheduleWithFixedDelay(new Task(), 10, 10, TimeUnit.SECONDS);
复制代码


用法:


public class MyThreadPoolTest {
public static void main(String[] args) { ScheduledExecutorService executorService = Executors.newScheduledThreadPool(10); for (int i = 0; i < 10000; i++) { executorService.schedule(new Thread(new Task()), 10, TimeUnit.SECONDS); } executorService.shutdown(); }
static class Task implements Runnable {
public void run() { System.out.println("Thread Name: " + Thread.currentThread().getName()); }
}}
复制代码


SingleThreadScheduledExecutor(定时或周期的单线程线程池)


源码:


public static ScheduledExecutorService newSingleThreadScheduledExecutor() {    return new DelegatedScheduledExecutorService            (new ScheduledThreadPoolExecutor(1));}
public ScheduledThreadPoolExecutor(int corePoolSize) { super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS, new DelayedWorkQueue());}
复制代码

SingleThreadScheduledExecutor 只有一个线程且支持定时、周期功能。很明显是 ScheduledThreadPool 和 SingleThreadExecutor 的结合体。适用于对执行顺序有要求,且需要定时或周期执行的任务


用法:


public class MyThreadPoolTest {
public static void main(String[] args) { ScheduledExecutorService executorService = Executors.newSingleThreadScheduledExecutor(); for (int i = 0; i < 10000; i++) { executorService.schedule(new Thread(new Task()), 10, TimeUnit.SECONDS); } executorService.shutdown(); }
static class Task implements Runnable {
public void run() { System.out.println("Thread Name: " + Thread.currentThread().getName()); }
}}
复制代码


巨人的肩膀



总结


本文聊了聊线程池是什么?为什么?怎么用?以及分析了线程池的执行过程,各参数含义、Java 各线程池的使用以及使用场景。相信你看完会有所收获,当然,由于篇幅原因,阻塞队列、拒绝策略等参数后面再发文探讨。另外,如文章有错,请友善指正,感激不尽。


小福利


如果看到这里,喜欢这篇文章的话,请帮点个好看。微信搜索一个优秀的废人,关注后回复电子书送你 1000+ 本编程电子书 ,不只 Java 哦,详情看下图。回复 1024 送你一套完整的某课网 java 就业班视频教程。


发布于: 2021 年 03 月 11 日阅读数: 17
用户头像

Java工程师 2018.09.17 加入

微信公众号:一个优秀的废人

评论

发布
暂无评论
万字长文,肝了一下午的线程池详解!