写点什么

☕【Java 技术之旅】从底层角度去认识线程的原理

发布于: 2021 年 05 月 23 日
☕【Java技术之旅】从底层角度去认识线程的原理

每日一句

当别人放弃的时候,你还在坚持,你就已经成功了!

前提概要

并发并不一定只依赖多线程的技术,但编程领域里谈论并发大多数情况下都与线程脱离不了关系。

线程的介绍

线程是比进程更轻量级的调度执行单位,线程的引入可以把一个进程的资源分配和执行调度分开,各个线程既可以共享进程资源(内存地址,文件 IO 等),又可以独立调度(线程是 CPU 调度执行的基本单位)。

线程的实现

线程的实现方式主要有三种方式:使用内核线程实现,使用用户线程实现和使用用户线程加轻量级进程混合实现。

内核线程实现

内核线程(KLT,Kernel-Level Thread),直接由操作系统内核(Kernel,即内核)支持的线程。

  • 内核来完成线程切换,内核通过操纵调度器(Scheduler)对线程进行调度,并负责将线程的任务映射到各个处理器上。

  • 每个内核线程(逻辑内核)可以视为内核(物理内核)的一个分身,这样操作系统就有能力同时处理多件事情,支持多线程的内核叫做多线程内核(物理内核中有多个逻辑内核)。

轻量级进程技术(LWP)
  • 程序一般不会去直接使用内核线程,而是去使用内核线程的一种高级接口——轻量级进程(LWP)即通常意义上的线程

  • 一个进程可以拥有多个轻量级进程,每个轻量级进程又有与之对应的内核线程(KLT)

  • 由于每个轻量级进程都由一个内核线程支持,因此只有先支持内核线程,才能有轻量级进程

  • 轻量级进程与内核线程之间 1:1 关系称为一对一的线程模型

  • 通过内核调度器进行调度相关的内核线程去分配到不同的 cpu 处理器区执行(物理处理器)

  • 内核线程保证了每个轻量级进程都成为一个独立的调度单元,即使有一个轻量级进程在系统调用中阻塞了,也不会影响整个进程的继续工作。

轻量级进程技术局限

基于内核线程实现,因此各线程操作等需要系统调用,系统调用代价高,需要在用户态和内核态来回切换,其次,每个轻量级进程都需要一个内核线程的支持,因此轻量级进程要消耗一定的内核资源,如内核线程的栈空间,因此一个系统支持轻量级进程的数量是有限的

使用用户线程实现

广义上,内核线程以外,就是用户线程:轻量级进程也算用户线程,但轻量级进程的实现始终是建立在内核上的,许多操作都要进行系统调度,效率会受到限制

狭义上,用户线程指完全建立在用户空间的线程库上。这种线程不需要切换内核态,效率非常高且低消耗,也可以支持规模更大的线程数量,部分高性能数据库中的多线程就是由用户线程实现的

这种进程与用户线程之间 1:N 的关系称为一对多的线程模型


  • 用户线程优势在于不需要系统内核支援,劣势也在于没有系统内核的支援,所有的线程操作都是需要用户程序自己处理

  • 阻塞处理等问题的解决十分困难,甚至不可能完成。所以使用用户线程会非常复杂。

用户线程加轻量级进程混合实现

本质是内核线程与用户线程混合使用,可以使用内核提供的线程调度功能及处理器映射,并且用户线程的系统调用要通

过轻量级进程来完成,大大降低整个进程被完全阻塞的风险

用户线程与轻量级进程比例是 N:M。


Java 中的线程

Java 中的线程对象用 Thread 类来表示,Thread 类的所有关键方法都声明了 native 的,意味着这个方法没有使用或无法使用平台无关的手段来实现,也有可能是为了执行效率。

不同版本 Java 中的线程的实现

  • JDK1.2 之前绿色线程—纯用户线程

  • JDK1.2 之后基于操作系统原生线程模型来实现Sun JDK它的 Windows 版本和 Linux 版本都使用一对一的线程模型实现,Java 线程就映射到一条轻量级进程之中。Solaris 同时支持一对一和多对多。

Java 线程调度

线程调度是指系统为线程分配处理器使用权的过程,主要调度方式分两种分别是协同式线程调度和抢占式线程调度。

  • 协同式线程调度,线程执行时间由线程本身来控制,线程把自己的工作执行完之后,要主动通知系统切换到另外一个线程上。最大好处是实现简单,且切换操作对线程自己是可知的,没啥线程同步问题。坏处是线程执行时间不可控制,如果一个线程有问题,可能一直阻塞在那里

  • 抢占式调度,每个线程将由系统来分配执行时间,线程的切换不由线程本身来决定(Java 中,Thread.yield()可以让出执行时间,但无法获取执行时间)。线程执行时间系统可控,也不会有一个线程导致整个进程阻塞。

Java 线程调度就是抢占式调度。
  • 系统能给某些线程多分配一些时间,给一些线程少分配一些时间,可以通过设置线程优先级来完成。

  • Java 语言一共 10 个级别的线程优先级(Thread.MIN_PRIORITY 至 Thread.MAX_PRIORITY),在两线程同时处于 ready 状态时,优先级越高的线程越容易被系统选择执行。但优先级并不是很靠谱,因为 Java 线程是通过映射到操作系统的原生线程上来实现的,所以线程调度最终还是取决于操作系统

状态转换

Java 定义了 5 种线程状态,在任意一个点一个线程只能有且只有其中一种状态。无限等待和等待可以算在一起。所以共五种

  1. 新建(New):创建后尚未启动的线程

  2. 运行(Runnable):Runnable 包括操作系统线程状态中的 Running 和 Ready,也就是处于此状态的线程有可能正在执行,也有可能等待 CPU 为它分配执行时间。线程对象创建后,其他线程调用了该对象的 start()方法。该状态的线程位于“可运行线程池”中,变得可运行,只等待获取 CPU 的使用权。即在就绪状态的进程除 CPU 之外,其它的运行所需资源都已全部获得

  3. 无限期等待(Waiting):该状态下线程不会被分配 CPU 执行时间,要等待被其他线程显式唤醒。如没有设置 timeout 的 object.wait()方法和 Thread.join()方法,以及 LockSupport.park()方法

  4. 限期等待(Timed Waiting):不会被分配 CPU 执行时间,不过无须等待被其他线程显式唤醒,在一定时间之后会由系统自动唤醒。如 Thread.sleep(),设置了 timeout 的 object.wait()和 thread.join(),LockSupport.parkNanos()以及 LockSupport.parkUntil()方法

  5. 阻塞(Blocked):线程被阻塞了。与等待状态的区别是:阻塞在等待着获取到一个排他锁,这个事件将在另外一个线程放弃这个锁的时候发生;而等待则在等待一段时间,或唤醒动作的发生。在等待进入同步区域时,线程将进入这种状态

阻塞状态是线程因为某种原因放弃 CPU 使用权,暂时停止运行。直到线程进入就绪状态,才有机会转到运行状态。(yield 或者 synchronized 同步锁)的场景

阻塞的情况分三种:
  • (1)、等待阻塞:运行的线程执行 wait()方法,该线程会释放占用的所有资源,JVM 会把该线程放入“等待池”中。进入这个状态后,是不能自动唤醒的,必须依靠其他线程调用 notify()或 notifyAll()方法才能被唤醒,即无限期等待,此外还有 LockSupport.park()以及先关的 Thread.join 中的本质就是调用了 thread(Object)的 wait 方法

  • (2)、**同步阻塞:运行的线程在获取对象的同步锁时,若该同步锁被别的线程占用,则 JVM 会把该线- 程放入“锁池”中(synchronized)。 **

  • (3)、其他阻塞:运行的线程执行 sleep()或 join()方法,或者发出了 I/O 请求时,JVM 会把该线程置为阻塞状态。当 sleep()状态超时、join()等待线程终止或者超时、或者 I/O 处理完毕时,线程重新转入就绪状态。即限期等待。此外还有 LockSupport.park(timeout)等

  1. 结束(Terminated):线程执行完了或者因异常退出了 run()方法,该线程结束生命周期

这种情况下,五个状态分为 新建,就绪,运行,阻塞,终止,如下图所示。



用户头像

我们始于迷惘,终于更高水平的迷惘。 2020.03.25 加入

🏆 【酷爱计算机技术、醉心开发编程、喜爱健身运动、热衷悬疑推理的”极客狂人“】 🏅 【Java技术领域,MySQL技术领域,APM全链路追踪技术及微服务、分布式方向的技术体系等】 🤝未来我们希望可以共同进步🤝

评论 (2 条评论)

发布
用户头像
线程的状态应该是6种,还有一个Terminated,Thread#State中好像是有定义的;另外java的线程调度模式到底是协调式还是抢占式,其实是说不清的,因为确实使用了时间片轮转算法来进行调度,但是如果想要中断线程,是先发送信号,随后被中断线程响应该信号进行一系列的操作,所以至于是抢占式还是协调式得从不同的角度去看吧
2021 年 05 月 25 日 17:31
回复
赞,谢谢 提的意见很中肯哦,我会好好研究一下 下次好好完善的,我的解释是:在线程的调度方式 主要依靠于物理内核的调度去控制,底层的执行者都是逻辑内核执行的内核线程操作此外协调方式去控制更多的是一种自我控制机制的掌握的思想用于到的场景主要集中在这几方面 (JVM的safepoint和AQS的相关state)、Linux本身来讲属于分片(分时操作系统)的、而windows确实在底层内核角度而言属于抢占方法(有点和分片区别,比较复杂和多元化因素(包括了实时逻辑在里面))(就是可能会存在非公平的概念以及饥饿的概念),如果我的答案有问题 ,可以多多指正 一起探讨哈。哈哈
2021 年 05 月 25 日 18:12
回复
没有更多了
☕【Java技术之旅】从底层角度去认识线程的原理