不明白线程池?那看看这篇,附 10 道面试题
为什么要用线程池呢?
下面是一段创建线程并运行的代码:
我们想使用这种方式去做异步,或者提高性能,然后将某些耗时操作放入一个新线程去运行。
这种思路是没问题的,但是这段代码是存在问题的,有哪些问题呢?下面我们就来看看有哪些问题;
创建销毁线程资源消耗;我们使用线程的目的本是出于效率考虑,可以为了创建这些线程却消耗了额外的时间,资源,对于线程的销毁同样需要系统资源。
cpu 资源有限,上述代码创建线程过多,造成有的任务不能即时完成,响应时间过长。
线程无法管理,无节制地创建线程对于有限的资源来说似乎成了“得不偿失”的一种作用。
既然我们上面使用手动创建线程会存在问题,那有解决方法吗?
答案:有的,使用线程池。
线程池介绍
线程池(Thread Pool):把一个或多个线程通过统一的方式进行调度和重复使用的技术,避免了因为线程过多而带来使用上的开销。
线程池有什么优点?
降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。
提高响应速度。当任务到达时,任务可以不需要等到线程创建就能立即执行。
提高线程的可管理性。
线程池使用
在 JDK 中 rt.jar 包下 JUC(java.util.concurrent)创建线程池有两种方式:ThreadPoolExecutor 和 Executors,其中 Executors 又可以创建 6 种不同的线程池类型。
ThreadPoolExecutor 的使用
线程池使用代码如下:
以上程序执行结果如下:
田先生您好
核心参数说明
ThreadPoolExecutor 的构造方法有以下四个:
可以看到最后那个构造方法有 7 个构造参数,其实前面的三个构造方法只是对最后那个方法进行包装,并且前面三个构造方法最终都是调用最后那个构造方法,所以我们这里就来聊聊最后那个构造方法。
参数解释
corePoolSize
线程池中的核心线程数,默认情况下核心线程一直存活在线程池中,如果将 ThreadPoolExecutor 的 allowCoreThreadTimeOut 属性设为 true,如果线程池一直闲置并超过了 keepAliveTime 所指定的时间,核心线程就会被终止。
maximumPoolSize
最大线程数,当线程不够时能够创建的最大线程数。
keepAliveTime
线程池的闲置超时时间,默认情况下对非核心线程生效,如果闲置时间超过这个时间,非核心线程就会被回收。如果 ThreadPoolExecutor 的 allowCoreThreadTimeOut 设为 true 的时候,核心线程如果超过闲置时长也会被回收。
unit
配合 keepAliveTime 使用,用来标识 keepAliveTime 的时间单位。
workQueue
线程池中的任务队列,使用 execute() 或 submit() 方法提交的任务都会存储在此队列中。
threadFactory
为线程池提供创建新线程的线程工厂。
rejectedExecutionHandler
线程池任务队列超过最大值之后的拒绝策略,RejectedExecutionHandler 是一个接口,里面只有一个 rejectedExecution 方法,可在此方法内添加任务超出最大值的事件处理。ThreadPoolExecutor 也提供了 4 种默认的拒绝策略:
DiscardPolicy():丢弃掉该任务,不进行处理。
DiscardOldestPolicy():丢弃队列里最近的一个任务,并执行当前任务。
AbortPolicy():直接抛出 RejectedExecutionException 异常(默认)。
CallerRunsPolicy():既不抛弃任务也不抛出异常,直接使用主线程来执行此任务。
包含所有参数的使用案例:
运行输出:
这里仅仅是为了演示所有参数自定义,并没有其他用途。
execute() 和 submit()的使用
execute() 和 submit() 都是用来执行线程池的,区别在于 submit() 方法可以接收线程池执行的返回值。
下面分别来看两个方法的具体使用和区别:
以上程序执行结果如下:
Executors
Executors 执行器创建线程池很多基本上都是在 ThreadPoolExecutor 构造方法上进行简单的封装,特殊场景根据需要自行创建。可以把 Executors 理解成一个工厂类 。Executors 可以创建 6 种不同的线程池类型。
下面对这六个方法进行简要的说明:
newFixedThreadPool
创建一个数量固定的线程池,超出的任务会在队列中等待空闲的线程,可用于控制程序的最大并发数。
newCacheThreadPool
短时间内处理大量工作的线程池,会根据任务数量产生对应的线程,并试图缓存线程以便重复使用,如果限制 60 秒没被使用,则会被移除缓存。如果现有线程没有可用的,则创建一个新线程并添加到池中,如果有被使用完但是还没销毁的线程,就复用该线程。终止并从缓存中移除那些已有 60 秒钟未被使用的线程。因此,长时间保持空闲的线程池不会使用任何资源。
newScheduledThreadPool
创建一个数量固定的线程池,支持执行定时性或周期性任务。
newWorkStealingPool
Java 8 新增创建线程池的方法,创建时如果不设置任何参数,则以当前机器 CPU 处理器数作为线程个数,此线程池会并行处理任务,不能保证执行顺序。
newSingleThreadExecutor
创建一个单线程的线程池。这个线程池只有一个线程在工作,也就是相当于单线程串行执行所有任务。如果这个唯一的线程因为异常结束,那么会有一个新的线程来替代它。此线程池保证所有任务的执行顺序按照任务的提交顺序执行。
newSingleThreadScheduledExecutor
此线程池就是单线程的 newScheduledThreadPool。
线程池如何关闭?
线程池关闭,可以使用 shutdown() 或 shutdownNow() 方法,它们的区别是:
shutdown():不会立即终止线程池,而是要等所有任务队列中的任务都执行完后才会终止。执行完 shutdown 方法之后,线程池就不会再接受新任务了。
shutdownNow():执行该方法,线程池的状态立刻变成 STOP 状态,并试图停止所有正在执行的线程,不再处理还在池队列中等待的任务,执行此方法会返回未执行的任务。
下面用代码来模拟 shutdown() 之后,给线程池添加任务,代码如下:
以上程序执行结果如下:
可以看出,shutdown() 之后就不会再接受新的任务了,不过之前的任务会被执行完成。
面试题
面试题 1:ThreadPoolExecutor 有哪些常用的方法?
ThreadPoolExecutor 有如下常用方法:
submit()/execute():执行线程池
shutdown()/shutdownNow():终止线程池
isShutdown():判断线程是否终止
getActiveCount():正在运行的线程数
getCorePoolSize():获取核心线程数
getMaximumPoolSize():获取最大线程数
getQueue():获取线程池中的任务队列
allowCoreThreadTimeOut(boolean):设置空闲时是否回收核心线程
这些方法可以用来终止线程池、线程池监控等。
面试题 2:说说 submit(和 execute 两个方法有什么区别?
submit() 和 execute() 都是用来执行线程池的,只不过使用 execute() 执行线程池不能有返回方法,而使用 submit() 可以使用 Future 接收线程池执行的返回值。
说说线程池创建需要的那几个核心参数的含义
ThreadPoolExecutor 最多包含以下七个参数:
corePoolSize:线程池中的核心线程数
maximumPoolSize:线程池中最大线程数
keepAliveTime:闲置超时时间
unit:keepAliveTime 超时时间的单位(时/分/秒等)
workQueue:线程池中的任务队列
threadFactory:为线程池提供创建新线程的线程工厂
rejectedExecutionHandler:线程池任务队列超过最大值之后的拒绝策略
面试题 3:shutdownNow() 和 shutdown() 两个方法有什么区别?
shutdownNow() 和 shutdown() 都是用来终止线程池的,它们的区别是,使用 shutdown() 程序不会报错,也不会立即终止线程,它会等待线程池中的缓存任务执行完之后再退出,执行了 shutdown() 之后就不能给线程池添加新任务了;shutdownNow() 会试图立马停止任务,如果线程池中还有缓存任务正在执行,则会抛出 java.lang.InterruptedException: sleep interrupted 异常。
面试题 6:了解过线程池的工作原理吗?
当线程池中有任务需要执行时,线程池会判断如果线程数量没有超过核心数量就会新建线程池进行任务执行,如果线程池中的线程数量已经超过核心线程数,这时候任务就会被放入任务队列中排队等待执行;如果任务队列超过最大队列数,并且线程池没有达到最大线程数,就会新建线程来执行任务;如果超过了最大线程数,就会执行拒绝执行策略。
面试题 5:线程池中核心线程数量大小怎么设置?
「CPU 密集型任务」:比如像加解密,压缩、计算等一系列需要大量耗费 CPU 资源的任务,大部分场景下都是纯 CPU 计算。尽量使用较小的线程池,一般为 CPU 核心数+1。因为 CPU 密集型任务使得 CPU 使用率很高,若开过多的线程数,会造成 CPU 过度切换。
「IO 密集型任务」:比如像 MySQL 数据库、文件的读写、网络通信等任务,这类任务不会特别消耗 CPU 资源,但是 IO 操作比较耗时,会占用比较多时间。可以使用稍大的线程池,一般为 2*CPU 核心数。IO 密集型任务 CPU 使用率并不高,因此可以让 CPU 在等待 IO 的时候有其他线程去处理别的任务,充分利用 CPU 时间。
另外:线程的平均工作时间所占比例越高,就需要越少的线程;线程的平均等待时间所占比例越高,就需要越多的线程;
以上只是理论值,实际项目中建议在本地或者测试环境进行多次调优,找到相对理想的值大小。
面试题 7:线程池为什么需要使用(阻塞)队列?
主要有三点:
因为线程若是无限制的创建,可能会导致内存占用过多而产生 OOM,并且会造成 cpu 过度切换。
创建线程池的消耗较高。
面试题 8:线程池为什么要使用阻塞队列而不使用非阻塞队列?
阻塞队列可以保证任务队列中没有任务时阻塞获取任务的线程,使得线程进入 wait 状态,释放 cpu 资源。
当队列中有任务时才唤醒对应线程从队列中取出消息进行执行。
使得在线程不至于一直占用 cpu 资源。
(线程执行完任务后通过循环再次从任务队列中取出任务进行执行,代码片段如下
不用阻塞队列也是可以的,不过实现起来比较麻烦而已,有好用的为啥不用呢?
面试题 9:了解线程池状态吗?
通过获取线程池状态,可以判断线程池是否是运行状态、可否添加新的任务以及优雅地关闭线程池等。
RUNNING:线程池的初始化状态,可以添加待执行的任务。
SHUTDOWN:线程池处于待关闭状态,不接收新任务仅处理已经接收的任务。
STOP:线程池立即关闭,不接收新的任务,放弃缓存队列中的任务并且中断正在处理的任务。
TIDYING:线程池自主整理状态,调用 terminated() 方法进行线程池整理。
TERMINATED:线程池终止状态。
面试题 10:知道线程池中线程复用原理吗?
线程池将线程和任务进行解耦,线程是线程,任务是任务,摆脱了之前通过 Thread 创建线程时的一个线程必须对应一个任务的限制。
在线程池中,同一个线程可以从阻塞队列中不断获取新任务来执行,其核心原理在于线程池对 Thread 进行了封装,并不是每次执行任务都会调用 Thread.start() 来创建新线程,而是让每个线程去执行一个“循环任务”,在这个“循环任务”中不停的检查是否有任务需要被执行,如果有则直接执行,也就是调用任务中的 run 方法,将 run 方法当成一个普通的方法执行,通过这种方式将只使用固定的线程就将所有任务的 run 方法串联起来。
总结
本文通过没有使用线程池带来的弊端,Executors 介绍,Executors 的六种方法介绍、如何使用线程池,了解线程池原理,核心参数,以及 10 到线程池面试题。
「成功不是将来才有的,而是从决定去做的那一刻起,持续累积而成。」
版权声明: 本文为 InfoQ 作者【田维常】的原创文章。
原文链接:【http://xie.infoq.cn/article/3f6e3c35fd50d993ad2b58d7e】。文章转载请联系作者。
评论