有没有字节工牌,Java 并发安全的根本原因都得懂
真正的大师永远怀着一颗学徒的心
引言
并发问题一直是Java
领域的高阶问题,要想掌握它不仅需要了解JVM
的内存模型,更需要对计算机底层硬件有深入的理解。本文主要探讨下Java
并发安全问题的根源所在,通过对根源问题对探究,加深对于Java
并发安全的理解。
并发安全问题分析
我们都知道程序猿编写的代码都是跑在具体的硬件架构上面的,只是目前的高级语言系统屏蔽了很多底层硬件细节。但是如果想要对于并发问题有深入的理解,还是需要对底层计算机硬件系统的细节有更多的了解。因此要想分析并发安全问题的根本原因,我们需要从问题现象出发,刨根问底,深入研究才能找到问题的答案。
计算机内存模型
首先从计算机硬件系统出发,我们可以将计算机系统简化为三大部件,即CPU
、内存以及IO
设备。随着技术的不断发展,计算机硬件也有了长足的发展。各大部件的能力与日俱增。但是有一个问题一直围绕在计算机硬件结构周围,那就是CPU
、内存以及IO
设备之间的数据访问速度有着巨大的速度差异。正式由于这种访问速度的巨大差异造成了影响程序性能的最大因素正是最慢的IO
设备,因此如果需要提升整体的性能,仅仅提高某一项是不够的,要从整体出发,充分发挥CPU
性能优势。
为了应对这种数据读取速率差异,CPU
中增加了高速缓存,来平衡其与内存的速度差异。操作系统通过增加进程、线程,以便与最大可能分时复用 CPU
,充分挖掘CPU
性能。
在 CPU 中都会有一个高速缓冲区,在实际运行过程中,CPU
首先从计算机主存中将数据复制到高速缓冲区中。CPU
在进行运算时,直接基于高速缓冲区的数据进行运算,逻辑运算之后,再将高速缓冲区的数据刷新到主存中。通过这样的方式,CPU
的执行指令的速度就可以大大提升。
在单核 CPU 时代,程序中所有的线程都跑在这颗独苗CPU
中,由于所有当线程都是操作同一块CPU
的缓存,因此据一个线程对缓存的操作,对另外一个线程来说一定是可见的。因此不存在线程安全的问题。
但是当在多核CPU
场景下,线程跑在不同当CPU
中,因此对变量进行逻辑操作时,对其他线程不可见,因此会存在并发安全问题。
到此,我们分析出了并发安全的第一个根源,即缓存导致的数据可见性问题,由于存在CPU
高速缓存,不同线程所在不同的CPU
在计算后结果互不可见,这才导致了并发安全问题。
JVM 内存模型
JVM
定义的内存模型实际是计算机硬件架构在JVM
中的映射体现。内存模型屏蔽了不同操作系统与内存硬件的访问差异。Java
的内存模型如图所示:
JVM
启动运行之后,操作系统会为该JVM
进程分配制定的的内存空间,这部分内存空间即为上图中的主内存。实际我们的Java
程序的所有工作都由线程来完成,而每个线程都会有一小块内存,即所谓的工作内存。Java
中的线程在执行的过程中,会先将数据从主内存中复制到线程的工作内存,然后再执行计算,执行计算之后,再把计算结果刷新到主内存中。
我们一起来分析下count++
在多线程场景下无法得到预期结果的原因。
对于count++
的操作 看上去是执行了一条指令实际上包含了三条指令。
(1)首先,需要把变量count
从内存加载到工作线程的工作内存中;
(2)加载后在工作内存中执行+1
操作;
(3)最后,将计算结果写入内存。
如上文所说的,由于计算机的大部件之间存在数据处理速度差异,处理一项任务时往往是CPU
在等待其他部件完成后才进行后续的操作,为了提高CPU
的工作效率,可以在CPU
等待期间让出 CPU 使用权,让CPU
去处理其他事情,这就是所谓的分时复用。那么在Java
多线程场景下,必定也会发生线程切换,如下图所示,由于count++
不具备运算的原子性,导致了线程在运行过程中发生线程切换,最终导致输出结果与预期不一致。
我们把一个或者多个操作在 CPU
执行的过程中不被中断的特性称为原子性。如上面的例子,如果保证了count++
的原子特性,那么就不会有并发安全问题了。
总结
本文从计算机内存模型出发,再到JVM
内存,分析了Java
并发安全问题根本原因分别是多线程下的数据可可见性以及线程切换带来的原子性问题。那么这些问题应该怎么解决呢?在下一篇文章中,我们再继续探讨。
我是慕枫,感谢各位小伙伴点赞、收藏和评论,文章持续跟新,我们下期再见!
微信搜索:慕枫技术笔记,优质文章持续更新,我们有学习打卡的群可以拉你进,一起努力冲击大厂,另外有很多学习以及面试的材料提供给大家。
版权声明: 本文为 InfoQ 作者【慕枫技术笔记】的原创文章。
原文链接:【http://xie.infoq.cn/article/92dd49bf32f4be849d8937dda】。文章转载请联系作者。
评论