面试官:Java 线程如何启动的?
摘要:Java 的线程创建和启动非常简单,但如果问一个线程是怎么启动起来的往往并不清楚,甚至不知道为什么启动时是调用 start(),而不是调用 run()方法呢?
本文分享自华为云社区《Thread.start() ,工作这么久,还不知道它是怎么让线程跑起来的!》,作者:小傅哥。
面试官:我考你个题,看看你进大厂的几率大不。嗯... Java 线程如何启动的?
谢飞机:如何启动的?start 启动的!
面试官:还有吗?
谢飞机:嗯…,没了!
面试官:嗯,可能会与不会这一个题并不会让你代码有多牛、有多好,但是你的技术栈深度和广度,决定你的编程职业生涯是否有一条康庄大道。还是要多努力!
一、线程启动分析
咳咳,Java 的线程创建和启动非常简单,但如果问一个线程是怎么启动起来的往往并不清楚,甚至不知道为什么启动时是调用 start(),而不是调用 run()方法呢?
那么,为了让大家有一个更直观的认知,我们先站在上帝视角。把这段 Java 的线程代码,到 JDK 方法使用,以及 JVM 的相应处理过程,展示给大家,以方便我们后续逐步分析。
以上,就是一个线程启动的整体过程分析,会涉及到如下知识点:
线程的启动会涉及到本地方法(JNI)的调用,也就是那部分 C++ 编写的代码。
JVM 的实现中会有不同操作系统对线程的统一处理,比如:Win、Linux、Unix。
线程的启动会涉及到线程的生命周期状态(RUNNABLE),以及唤醒操作,所以最终会有回调操作。也就是调用我们的 run() 方法
接下来,我们就开始逐步分析每一步源码的执行内容,从而了解线程启动过程。
二、线程启动过程
1. Thread start UML 图
如图 19-2 是线程的启动过程时序图,整体的链路较长,会涉及到 JVM 的操作。核心源码如下:
jvm.cpp:https://github.com/JetBrains/jdk8u_hotspot/blob/master/src/share/vm/prims/jvm.cpp
thread.cpp:https://github.com/JetBrains/jdk8u_hotspot/blob/master/src/share/vm/runtime/thread.cpp
os.cpp:https://github.com/JetBrains/jdk8u_hotspot/blob/master/src/share/vm/runtime/os.hpp
os_linux.cpp:https://github.com/JetBrains/jdk8u_hotspot/blob/master/src/os/linux/vm/os_linux.cpp
os_windows.cpp:https://github.com/JetBrains/jdk8u_hotspot/blob/master/src/os/windows/vm/os_windows.cpp
vmSymbols.hpp:https://github.com/JetBrains/jdk8u_hotspot/blob/master/src/share/vm/classfile/vmSymbols.hpp
2. Java 层面 Thread 启动
2.1 start() 方法
线程启动方法 start(),在它的方法英文注释中已经把核心内容描述出来。
Causesthis thread to begin execution; the Java Virtual Machine calls the run methodof this thread. 这段话的意思是:由 JVM 调用此线程的 run 方法,使线程开始执行。其实这就是一个 JVM 的回调过程,下文源码分析中会讲到
另外 start() 是一个 synchronized 方法,但为了避免多次调用,在方法中会由线程状态判断。threadStatus != 0。
group.add(this),是把当前线程加入到线程组,ThreadGroup。
start0(),是一个本地方法,通过 JNI 方式调用执行。这一步的操作才是启动线程的核心步骤。
2.2 start0() 本地方法
start0(),是一个本地方法,用于启动线程。
registerNatives(),这个方法是用于注册线程执行过程中需要的一些本地方法,比如:start0、isAlive、yield、sleep、interrupt0 等。
registerNatives,本地方法定义在 Thread.c 中,以下是定义的核心源码:
从定义中可以看到,start0 方法会执行 &JVM_StartThread 方法,最终由 JVM 层面启动线程。
3. JVM 创建线程
3.1 JVM_StartThread
这部分代码比较多,但核心内容主要是创建线程和启动线程,另外 &thread_entry 也是一个方法,如下:
thread_entry,线程入口
重点,在创建线程引入这个线程入口的方法时,thread_entry 中包括了 Java 的回调函数 JavaCalls::call_virtual。这个回调函数会由 JVM 调用。
vmSymbols::run_method_name(),就是那个被回调的方法,源码如下:
这个 run 就是我们的 Java 程序中会被调用的 run 方法。接下来我们继续按照代码执行链路,寻找到这个被回调的方法在什么时候调用的。
3.2 JavaThread
接下来,我们继续看 JavaThread 的源码执行内容。
hreadFunctionentry_point,就是我们上面的 thread_entry 方法。
size_t stack_sz,表示进程中已有的线程个数。
这两个参数,都会传递给 os::create_thread 方法,用于创建线程使用。
3.3 os::create_thread
源码:
os_linux.cpp:https://github.com/JetBrains/jdk8u_hotspot/blob/master/src/os/linux/vm/os_linux.cpp
os_windows.cpp:https://github.com/JetBrains/jdk8u_hotspot/blob/master/src/os/windows/vm/os_windows.cpp
众所周知,JVM 是个啥!,所以它的 OS 服务实现,Liunx 还有 Windows 等,都会实现线程的创建逻辑。这有点像适配器模式 os_linux -> os::create_thread
osthread->set_state(ALLOCATED),初始化已分配的状态,但此时并没有初始化。
pthread_create,是类 Unix 操作系统(Unix、Linux、Mac OS X 等)的创建线程的函数。
java_start,重点关注类,是实际创建线程的方法。
3.4 java_start
JVM 设置线程状态,INITIALIZED 初始化完成。
sync->notify_all(),唤醒所有线程。
osthread->get_state()== INITIALIZED,while 循环等待
thread->run(),是等待线程唤醒后,也就是状态变更后,才能执行到。这在我们的线程执行 UML 图中,也有所体现
4. JVM 启动线程
JVM_StartThread 中有两步,创建(new JavaThread)、启动(Thread::start)。创建的过程聊完了,接下来我们聊启动。
4.1 Thread::start
如果没有禁用线程 DisableStartThread 并且是 Java 线程 thread->is_Java_thread(),那么设置线程状态为 RUNNABLE。
os::start_thread(thread),调用线程启动方法。不同的 OS 会有不同的启动代码逻辑
4.2 os::start_thread(thread)
osthread->set_state(RUNNABLE),设置线程状态 RUNNABLE
pd_start_thread(thread),启动线程,这个就由各个 OS 实现类,实现各自系统的启动方法了。比如,windows 系统和 Linux 系统的代码是完全不同的。
4.3 pd_start_thread(thread)
这部分代码 notify() 最关键,它可以唤醒线程。
线程唤醒后,3.4 中的 thread->run(); 就可以继续执行了。
5. JVM 线程回调
5.1 thread->run()[JavaThread::run()]
os_linux.cpp 类中的 java_start 里的 thread->run(),最终调用的就是 thread.cpp 的 JavaThread::run() 方法。
这部分还需要继续往下看,thread_main_inner(); 方法。
5.2 thread_main_inner
这里有你熟悉的设置的线程名称,this->set_native_thread_name(this->get_thread_name())。
this->entry_point(),实际调用的就是 3.1 中的 thread_entry 方法。
thread_entry,方法最终会调用到 JavaCalls::call_virtual 里的 vmSymbols::run_method_name()。也就是 run()方法,至此线程启动完成。终于串回来了!
三、总结
线程的启动过程涉及到了 JVM 的参与,所以如果没有认真了解过,确实很难从一个本地方法了解的如此透彻。
整个源码分析可以结合着代码调用 UML 时序图进行学习,基本核心过程包括:Java 创建线程和启动、调用本地方法 start0()、JVM 中 JVM_StartThread 的创建和启动、设置线程状态等待被唤醒、根据不同的 OS 启动线程并唤醒、最后回调 run()方法启动 Java 线程。
版权声明: 本文为 InfoQ 作者【华为云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/53f2587ae38fd991df8f96e7f】。文章转载请联系作者。
评论