☕【Java 技术之旅】从底层角度去认识线程的原理
每日一句
当别人放弃的时候,你还在坚持,你就已经成功了!
前提概要
并发并不一定只依赖多线程的技术,但编程领域里谈论并发大多数情况下都与线程脱离不了关系。
线程的介绍
线程是比进程更轻量级的调度执行单位,线程的引入可以把一个进程的资源分配和执行调度分开,各个线程既可以共享进程资源(内存地址,文件 IO 等),又可以独立调度(线程是 CPU 调度执行的基本单位)。
线程的实现
线程的实现方式主要有三种方式:使用内核线程实现,使用用户线程实现和使用用户线程加轻量级进程混合实现。
内核线程实现
内核线程(KLT,Kernel-Level Thread),直接由操作系统内核(Kernel,即内核)支持的线程。
内核来完成线程切换,内核通过操纵调度器(Scheduler)对线程进行调度,并负责将线程的任务映射到各个处理器上。
每个内核线程(逻辑内核)可以视为内核(物理内核)的一个分身,这样操作系统就有能力同时处理多件事情,支持多线程的内核叫做多线程内核(物理内核中有多个逻辑内核)。
轻量级进程技术(LWP)
程序一般不会去直接使用内核线程,而是去使用内核线程的一种高级接口——轻量级进程(LWP),即通常意义上的线程。
一个进程可以拥有多个轻量级进程,每个轻量级进程又有与之对应的内核线程(KLT)
由于每个轻量级进程都由一个内核线程支持,因此只有先支持内核线程,才能有轻量级进程。
轻量级进程与内核线程之间 1:1 关系称为一对一的线程模型。
通过内核调度器进行调度相关的内核线程去分配到不同的 cpu 处理器区执行(物理处理器)
内核线程保证了每个轻量级进程都成为一个独立的调度单元,即使有一个轻量级进程在系统调用中阻塞了,也不会影响整个进程的继续工作。
轻量级进程技术局限
基于内核线程实现,因此各线程操作等需要系统调用,系统调用代价高,需要在用户态和内核态来回切换,其次,每个轻量级进程都需要一个内核线程的支持,因此轻量级进程要消耗一定的内核资源,如内核线程的栈空间,因此一个系统支持轻量级进程的数量是有限的。
使用用户线程实现
广义上,内核线程以外,就是用户线程:轻量级进程也算用户线程,但轻量级进程的实现始终是建立在内核上的,许多操作都要进行系统调度,效率会受到限制。
狭义上,用户线程指完全建立在用户空间的线程库上。这种线程不需要切换内核态,效率非常高且低消耗,也可以支持规模更大的线程数量,部分高性能数据库中的多线程就是由用户线程实现的。
这种进程与用户线程之间 1:N 的关系称为一对多的线程模型。
用户线程优势在于不需要系统内核支援,劣势也在于没有系统内核的支援,所有的线程操作都是需要用户程序自己处理。
阻塞处理等问题的解决十分困难,甚至不可能完成。所以使用用户线程会非常复杂。
用户线程加轻量级进程混合实现
本质是内核线程与用户线程混合使用,可以使用内核提供的线程调度功能及处理器映射,并且用户线程的系统调用要通
过轻量级进程来完成,大大降低整个进程被完全阻塞的风险。
用户线程与轻量级进程比例是 N:M。
Java 中的线程
Java 中的线程对象用 Thread 类来表示,Thread 类的所有关键方法都声明了 native 的,意味着这个方法没有使用或无法使用平台无关的手段来实现,也有可能是为了执行效率。
不同版本 Java 中的线程的实现
JDK1.2 之前:绿色线程—纯用户线程。
JDK1.2 之后:基于操作系统原生线程模型来实现。Sun JDK,它的 Windows 版本和 Linux 版本都使用一对一的线程模型实现,Java 线程就映射到一条轻量级进程之中。Solaris 同时支持一对一和多对多。
Java 线程调度
线程调度是指系统为线程分配处理器使用权的过程,主要调度方式分两种:分别是协同式线程调度和抢占式线程调度。
协同式线程调度,线程执行时间由线程本身来控制,线程把自己的工作执行完之后,要主动通知系统切换到另外一个线程上。最大好处是实现简单,且切换操作对线程自己是可知的,没啥线程同步问题。坏处是线程执行时间不可控制,如果一个线程有问题,可能一直阻塞在那里。
抢占式调度,每个线程将由系统来分配执行时间,线程的切换不由线程本身来决定(Java 中,Thread.yield()可以让出执行时间,但无法获取执行时间)。线程执行时间系统可控,也不会有一个线程导致整个进程阻塞。
Java 线程调度就是抢占式调度。
系统能给某些线程多分配一些时间,给一些线程少分配一些时间,可以通过设置线程优先级来完成。
Java 语言一共 10 个级别的线程优先级(Thread.MIN_PRIORITY 至 Thread.MAX_PRIORITY),在两线程同时处于 ready 状态时,优先级越高的线程越容易被系统选择执行。但优先级并不是很靠谱,因为 Java 线程是通过映射到操作系统的原生线程上来实现的,所以线程调度最终还是取决于操作系统。
状态转换
Java 定义了 5 种线程状态,在任意一个点一个线程只能有且只有其中一种状态。无限等待和等待可以算在一起。所以共五种。
新建(New):创建后尚未启动的线程。
运行(Runnable):Runnable 包括操作系统线程状态中的 Running 和 Ready,也就是处于此状态的线程有可能正在执行,也有可能等待 CPU 为它分配执行时间。线程对象创建后,其他线程调用了该对象的 start()方法。该状态的线程位于“可运行线程池”中,变得可运行,只等待获取 CPU 的使用权。即在就绪状态的进程除 CPU 之外,其它的运行所需资源都已全部获得。
无限期等待(Waiting):该状态下线程不会被分配 CPU 执行时间,要等待被其他线程显式唤醒。如没有设置 timeout 的 object.wait()方法和 Thread.join()方法,以及 LockSupport.park()方法。
限期等待(Timed Waiting):不会被分配 CPU 执行时间,不过无须等待被其他线程显式唤醒,在一定时间之后会由系统自动唤醒。如 Thread.sleep(),设置了 timeout 的 object.wait()和 thread.join(),LockSupport.parkNanos()以及 LockSupport.parkUntil()方法。
阻塞(Blocked):线程被阻塞了。与等待状态的区别是:阻塞在等待着获取到一个排他锁,这个事件将在另外一个线程放弃这个锁的时候发生;而等待则在等待一段时间,或唤醒动作的发生。在等待进入同步区域时,线程将进入这种状态。
阻塞状态是线程因为某种原因放弃 CPU 使用权,暂时停止运行。直到线程进入就绪状态,才有机会转到运行状态。(yield 或者 synchronized 同步锁)的场景
阻塞的情况分三种:
(1)、等待阻塞:运行的线程执行 wait()方法,该线程会释放占用的所有资源,JVM 会把该线程放入“等待池”中。进入这个状态后,是不能自动唤醒的,必须依靠其他线程调用 notify()或 notifyAll()方法才能被唤醒,即无限期等待,此外还有 LockSupport.park()以及先关的 Thread.join 中的本质就是调用了 thread(Object)的 wait 方法
(2)、**同步阻塞:运行的线程在获取对象的同步锁时,若该同步锁被别的线程占用,则 JVM 会把该线- 程放入“锁池”中(synchronized)。 **
(3)、其他阻塞:运行的线程执行 sleep()或 join()方法,或者发出了 I/O 请求时,JVM 会把该线程置为阻塞状态。当 sleep()状态超时、join()等待线程终止或者超时、或者 I/O 处理完毕时,线程重新转入就绪状态。即限期等待。此外还有 LockSupport.park(timeout)等
结束(Terminated):线程执行完了或者因异常退出了 run()方法,该线程结束生命周期。
这种情况下,五个状态分为 新建,就绪,运行,阻塞,终止,如下图所示。
评论 (2 条评论)