您的《操作系统线程模型总结》请查收。
1、写在开头
各种操作系统均提供了线程的实现(内核线程),线程是 CPU 进行工作调度的基本单位。
线程是比进程更轻量级的调度执行单位,线程的引入,可以把一个进程的资源分配和执行调度分开,各个线程既可以共享进程资源(内存地址、文件 I/O 等),又可以独立调度(线程是 CPU 调度的基本单位)。
而编程语言一般都会提供操作内核线程的 API, Java 也不例外。
操作内核线程的模型主要有如下三种:
使用内核线程(1:1 模型)
使用用户线程(1:N 模型)
使用用户线程 + 轻量级进程(LWP)(N:M 模型)
2、复习基础
我们先复习下操作系统中的几个关键概念:
内核线程 KLT:内核级线程(Kemel-Level Threads, KLT 也有叫做内核支持的线程),直接由操作系统内核支持,线程创建、销毁、切换开销较大
用户线程 UT:用户线程(User Thread,UT),建立在用户空间,系统内核不能感知用户线程的存在,线程创建、销毁、切换开销小
轻量级进程 LWP:(LWP,Light weight process)用户级线程和内核级线程之间的中间层,是由操作系统提供给用户的操作内核线程的接口的实现 。
进程 P:(Process)用户进程
3、操作系统的三种线程模型
3.1 内核线程模型:
内核线程模型即完全依赖操作系统内核提供的内核线程(Kernel-Level Thread ,KLT)来实现多线程。在此模型下,线程的切换调度由系统内核完成,系统内核负责将多个线程执行的任务映射到各个 CPU 中去执行。
3.1.1 解析:
程序一般不会直接去使用内核线程,而是去使用内核线程的一种高级接口——轻量级进程(Light Weight Process,LWP),轻量级进程就是我们通常意义上所讲的线程,由于每个轻量级进程都由一个内核线程支持,因此只有先支持内核线程,才能有轻量级进程。这种轻量级进程与内核线程之间 1:1 的关系称为一对一的线程模型。
3.1.2 总结:
内核线程模型下,线程调度 &线程切换都交给了 OS 来完成,可谓累坏了系统。
3.2 用户线程模型:
使用用户线程(User Thread)的优势在于不需要系统内核支援,劣势也在于没有系统内核的支援,所有的线程操作都需要用户程序自己处理。线程的创建、切换和调度都是需要考虑的问题,而且由于操作系统只把处理器资源分配到进程,那诸如“阻塞如何处理”、“多处理器系统中如何将线程映射到其他处理器上”这类问题解决起来将会异常困难,甚至不可能完成。
3.2.1 解析:
从广义上来讲,一个线程只要不是内核线程,就可以认为是用户线程(User Thread,UT),因此,从这个定义上来讲,轻量级进程也属于用户线程,但轻量级进程的实现始终是建立在内核之上的,许多操作都要进行系统调用,效率会受到限制。
因而使用用户线程实现的程序一般都比较复杂,此处所讲的“复杂”与“程序自己完成线程操作”,并不限制程序中必须编写了复杂的实现用户线程的代码,使用用户线程的程序,很多都依赖特定的线程库来完成基本的线程操作,这些复杂性都封装在线程库之中,除了以前在不支持多线程的操作系统中(如 DOS)的多线程程序与少数有特殊需求的程序外,现在使用用户线程的程序越来越少了,Java、Ruby 等语言都曾经使用过用户线程,最终又都放弃使用它。
3.2.2 总结:
用户线程模型下,线程调度 &线程切换都交给了开发者来完成,可谓累坏了开发者(加重了人的工作负担,思路很反人类啊)。
3.3 混合线程模型:
混合线程模型:线程除了依赖内核线程实现和完全由用户程序自己实现之外,还有一种将内核线程与用户线程一起使用的实现方式。在这种混合实现下,既存在用户线程,也存在轻量级进程。
3.3.1 解析:
用户线程还是完全建立在用户空间中,因此用户线程的创建、切换、析构等操作依然廉价,并且可以支持大规模的用户线程并发。而操作系统提供支持的轻量级进程则作为用户线程和内核线程之间的桥梁,这样可以使用内核提供的线程调度功能及处理器映射,并且用户线程的系统调用要通过轻量级线程来完成,大大降低了整个进程被完全阻塞的风险。
在这种混合模式中,用户线程与轻量级进程的数量比是不定的,即为 N:M 的关系。许多 UNIX 系列的操作系统,如 Solaris、HP-UX 等都提供了 N:M 的线程模型实现。
对于 Sun JDK 来说,它的 Windows 版与 Linux 版都是使用一对一的线程模型实现的,一条 Java 线程就映射到一条轻量级进程之中,因为 Windows 和 Linux 系统提供的线程模型就是一对一的。在 Solaris 平台中,由于操作系统的线程特性可以同时支持一对一(通过 Bound Threads 或 Alternate Libthread 实现)及多对多(通过 LWP/Thread Based Synchronization 实现)的线程模型,因此在 Solaris 版的 JDK 中也对应提供了两个平台专有的虚拟机参数:-XX:+UseLWPSynchronization(默认值)和-XX:+UseBoundThreads 来明确指定虚拟机使用哪种线程模型。
3.3.1 总结:
混合线程模型,人机合一,从人类视角出发,将困难计算的部分交给计算机完成,符合“可持续发展”理念。
4、操作系统的线程调度方式
线程调度是指系统为线程分配处理器使用权的过程。
主要的线程调度方式有两种,分别是 协同式线程调度(Cooperative Threads-Scheduling)和 抢占式线程调度(Preemptive Threads-Scheduling),见下图。
4.1 协同式调度
如果使用协同式调度的多线程系统,线程的执行时间由线程本身来控制,线程把自己的工作执行完了之后,要主动通知系统切换到另外一个线程上。
好处:
协同式多线程的最大好处是实现简单,而且由于线程要把自己的事情干完后才会进行线程切换,切换操作对线程自己是可知的,所以没有什么线程同步的问题。
不足:
Lua 语言中的“协同例程”就是这类实现。它的坏处也很明显:线程执行时间不可控制,甚至如果一个线程编写有问题,一直不告知系统进行线程切换,那么程序就会一直阻塞在那里。
很久以前的 Windows 3.x 系统就是使用协同式来实现多进程多任务的,相当不稳定,一个进程坚持不让出 CPU 执行时间就可能会导致整个系统崩溃。
4.2 抢占式调度
如果使用抢占式调度的多线程系统,那么每个线程将由系统来分配执行时间,线程的切换不由线程本身来决定(在 Java 中,Thread.yield()可以让出执行时间,但是要获取执行时间的话,线程本身是没有什么办法的)。
好处:
在这种实现线程调度的方式下,线程的执行时间是系统可控的,也不会有一个线程导致整个进程阻塞的问题。Java 使用的线程调度方式就是抢占式调度。在 JDK 后续版本中有可能会提供协程(Coroutines)方式来进行多任务处理。
与前面所说的 Windows 3.x 的例子相对,在 Windows 9x/NT 内核中就是使用抢占式来实现多进程的,当一个进程出了问题,我们还可以使用任务管理器把这个进程“杀掉”,而不至于导致系统崩溃。
4.2.1 线程优先级
虽然 Java 线程调度是系统自动完成的,但是我们还是可以“建议”系统给某些线程多分配一点执行时间,另外的一些线程则可以少分配一点——这项操作可以通过设置线程优先级来完成。
Java 语言一共设置了 10 个级别的线程优先级(Thread.MIN_PRIORITY 至 Thread.MAX_PRIORITY),在两个线程同时处于 Ready 状态时,优先级越高的线程越容易被系统选择执行。
不过,线程优先级并不是太靠谱,原因是 Java 的线程是通过映射到系统的原生线程上来实现的,所以线程调度最终还是取决于操作系统,虽然现在很多操作系统都提供线程优先级的概念,但是并不见得能与 Java 线程的优先级一一对应。
如 Solaris 中有 2147483648(232)种优先级,但 Windows 中就只有 7 种,比 Java 线程优先级多的系统还好说,中间留下一点空位就可以了,但比 Java 线程优先级少的系统,就不得不出现几个优先级相同的情况了。
Windows 平台的 JDK 中使用了除 THREAD_PRIORITY_IDLE 之外的其余 6 种线程优先级。
5、Java 定义的线程状态
5.1 线程源码
我们先瞅瞅 Thread.java 源码定义的枚举类:
源码节选:
5.2 线程状态分析:
Java 语言定义了 6 种线程状态,在任意一个时间点,一个线程只能有且只有其中的一种状态,这 6 种状态分别如下:
新建(New):创建后尚未启动的线程处于这种状态。
运行(Runable):Runable 包括了操作系统线程状态中的 Running 和 Ready,也就是处于此状态的线程有可能正在执行,也有可能正在等待着 CPU 为它分配执行时间。(待执行 &正在执行)
无限期等待(Waiting):处于这种状态的线程不会被分配 CPU 执行时间,它们要等待被其他线程显式地唤醒。
以下方法会让线程陷入无限期的等待状态:
没有设置 Timeout 参数的 Object.wait()方法。
没有设置 Timeout 参数的 Thread.join()方法。
LockSupport.park()方法。
限期等待(Timed Waiting):处于这种状态的线程也不会被分配 CPU 执行时间,不过无须等待被其他线程显式地唤醒,在一定时间之后它们会由系统自动唤醒。
以下方法会让线程进入限期等待状态:
Thread.sleep()方法。
设置了 Timeout 参数 Object 的方法:Object.wait(long timeout)方法/Object.wait(long timeout, int nanos)方法。
设置了 Timeout 参数的 Thread 方法:Thread.join(long millis, int nanos)/Thread.join(long millis)
LockSupport.parkNanos()方法。
LockSupport.parkUntil()方法。
阻塞(Blocked):线程被阻塞了,“阻塞状态”与“等待状态”的区别是:“阻塞状态”在等待着获取到一个排他锁,这个事件将在另外一个线程放弃这个锁的时候发生;而“等待状态”则是在等待一段时间,或者唤醒动作的发生。在程序等待进入同步区域的时候,线程将进入这种状态。
结束(Terminated):已终止线程的线程状态,线程已经结束执行。
5.3 六种线程状态的时序图:
6、Java 多线程实现
实现 1:继承 Thread 类
正确启动方式:(如果使用 myThread.run(),则相当于调用了一个普通类的同步方法,并未起到异步执行任务的效果)
实现 2:实现 Runnable 接口
实现 3:实现 Callable 接口,使用 FutureTask 获取异步返回值
实现 4:JDK8 以上版本使用 CompletableFuture 进行异步计算
在 Java8 中,提供了非常强大的 Future 的扩展功能,可以帮助我们简化异步编程的复杂性,并且提供了函数式编程的能力,可以通过回调的方式处理计算结果,也提供了转换和组合 CompletableFuture 的方法。
实现 5:使用线程池,ThreadPoolExecutor 类
7、总结
本节主要讲述了操作系统提供的三种线程模型和两种线程调度方式,同时补充了基于 Java 的 5 种多线程实现和 6 个线程状态的相关知识。希望各位回顾知识的同时也有新收获。GoodLuck!!
8、延伸阅读
《源码系列》
《经典书籍》
《Java并发编程实战:第2章 影响线程安全性的原子性和加锁机制》
《Java并发编程实战:第3章 助于线程安全的三剑客:final & volatile & 线程封闭》
《服务端技术栈》
《算法系列》
《设计模式》
版权声明: 本文为 InfoQ 作者【后台技术汇】的原创文章。
原文链接:【http://xie.infoq.cn/article/fb6b454992ba2888cc17d2e6f】。文章转载请联系作者。
评论