面试官:你说一下对 Java 中的 volatile 的理解吧
前言
volatile 相关的知识其实自己一直都是有掌握的,能大概讲出一些知识,例如:它可以保证可见性;禁止指令重排。这两个特性张口就来,但要再往深了问,具体是如何实现这两个特性的,以及在什么场景下使用 volatile,为什么不直接用 synchronized 这种深入和扩展相关的问题,就回答的不好了。因为 volatile 是 面试必问知识 ,所以这次准备把这部分知识也给啃掉。
系统处理效率与 Java 内存模型
在计算机中,每条程序指令都是在 CPU 中执行的,而 CPU 执行指令的数据都是临时存储在内存中的,但是 CPU 的执行速度远超内存的读取速度,如果所有的 CPU 指令都是通过内存来读取数据的话那么将大大的降低了系统的处理效率,所以现代计算机系统都不得不加入一层或多层读写速度尽可能接近处理器运算速度的高速缓存(Cache)来作为内存与处理器之间的缓冲。
将运算需要使用的数据复制到缓存中,让运算能快速进行,当运算结束后,再从缓存同步回内存之中,这样处理器就无须等待缓慢的内存读写了。
虽然说增加了高速缓存提高了 CPU 的处理效率,但是也带来了新的问题 :
现代计算机都是多核 CPU,一开始,内存中的变量 A 的值是 1,第一个 CPU 读取了数据,第二个 CPU 也将数据读取到了自己的高速缓存当中,当第一个 CPU 对变量 A 进行加 1 操作时,变量 A 的值变成了 2,然后将将变量 A 的值写回内存中,这时第二个 CPU 也对变量 A 进行加 1 操作时,由于第二个 CPU 中高速缓存中的值还是 1,所以加 1 操作后的结果为 2,然后第二个 CPU 又将变量 A 的值同步回内存中,这样就导致执行了两次加 1 操作后,变量 A 的值最终是 2,而不是 3。 这种被多个 CPU 访问的变量,通常称为共享变量。 而产生的上面的问题,就是引入了高速缓存后的,主内存和缓存内容不一致的问题。 因为每个处理器有自己的高速缓存,但是它们又共享同一块主内存,所以必然会出现主内存不知该以哪个高速缓存中的变量为准的情况。
上面这个缓存不一致的问题,我们先记下来,继续来看 Java 内存模型,其实 Java 内存模型描述的上面讲的计算机系统高速缓存和内存之间的关系类似。
Java 内存模型描述了,各种变量的访问规则,以及将变量存储到内存和从内存读取变量的这种底层细节。
在 Java 内存模型中关注的变量都是共享变量(实例变量、类变量)。 所有的共享变量都是存储在主内存中的,但是每个线程在访问变量的时候也都会在自己的工作内存(处理器高速缓存)中保留一份共享变量的副本。
Java 内存模型(Java Memory Model,简称 JMM)规定:
线程对变量的所有操作(读,写)都必须在工作内存中进行,不能直接操作主内存中的数据。 不同线程之间 也不能直接访问对方工作内存中的变量,线程间的变量值传递必须通过主内存进行中转传递。 在 JMM 中工作内存和主内存的关系如下图:
Volatile 的可见性(保证立即可见)
继续我们上面的缓存一致性的问题,这个问题,在 Java 内存模型中,就是可见性的问题,即一个线程修改了共享变量的值,对另一个线程来说是不是立即可见的。如果不是立即可见的,那么就会出现缓存一致性的问题,如果是立即可见的,那么另一个线程在进行操作的时候,拿到的变量值就是最新的。就可以解决可见性的问题。
那么怎么解决可见性问题呢?
方案一:加锁
将共享变量加锁,无论是 synchronized 还是 Lock 都可以,加锁达到的目的是在同一时间内只能有一个线程能对共享变量进行操作,就是说,共享变量从读取到工作内存到更新之后,同步回主内存的过程中,其他线程是操作不了这个变量的。这样自然就解决了可见性的问题了,但是这样的效率比较低,操作不了共享变量的线程就只能阻塞。
方案二:volatile 修饰修饰共享变量
当一个共享变量被 volatile 修饰后,会保证每个线程将变量修改后的值立即同步回主内存中,当其他线程有需要读取变量时会读取到最新的变量值。
那么 volatile 做了些什么操作就能解决可见性的问题呢?
就是线程对变量操作时会从主内存中读取到自己的工作内存中,当线程对变量进行了修改后,那么其他已经读取了此变量的线程中的变量副本就会失效,这样其他线程在使用变量的时候,发现已经失效,那么就会去主内存中重新获取,这样获取到的就只最新的值了。
那么 volatile 这个关键字是如何实现这套机制的呢?
因为一台计算机有多台 CPU,同一个变量,在多个 CPU 中缓存的值有可能不一样,那么以谁缓存的值为准呢?
既然大家都有自己的值,那么各个 CPU 间就产生了一种协议,来保证按照一定的规律为准,来确定共享变量的准确值,这样各个 CPU 在读写共享变量时都按照协议来操作。
这就是缓存一致性协议。
最著名的缓存一致性协议就是 Intel 的 MESI 了,说 MESI 时,先解释一下,缓存行:
缓存行(cache line):CPU 高速缓存的中可以分配的最小存储单位,高速缓存中的变量都是存在缓存行中的。
MESI 的核心思想就是,当 CPU 对变量进行写操作时发现,变量是共享变量,那么就会通知其他 CPU 中将该变量的缓存行设置为无效状态。当其他 CPU 在操作变量时发现此变量在的缓存行已经无效,那么就会去主内存中重新读取最新的变量。
那么其他 CPU 是如何发现变量被修改了的呢?
因为 CPU 和其他部件的进行通信是通过总线来进行的,所以每个 CPU 通过嗅探总线上的传播数据,来检查自己缓存的值是不是过期了,当处理器发现自己换成行对应的内存地址被修改后,就会将自己工作内存中的缓存行设置成无效状态,当 CPU 对此变量进行修改时会重新从系统主内存中读取变量。
Volatile 的有序性(禁止指令重排)
一般来说,我们写程序的时候,都是要把先代码从上往下写,默认的认为程序是自顶向下顺序执行的,但是 CPU 为了提高效率,在保证最终结果准确的情况下,是会对指令进行重新排序的。就是说写在前的代码不一定先执行,在后面的也不一定先执行。
举个例子:
上面四行代码的执行顺序有可能是
JMM 在是允许指令重排序的,在保证最后结果正确的情况下,处理器可以尽情地发挥,提高执行效率。
当多个线程执行代码的时候重排序的情况就更为突出了,各个 CPU 为了提高自己的效率,有可能会产生竞争情况,这样就有可能导致最终执行的正确性。
所以为了保证在多个线程下最终执行的正确性,将变量用 volatile 进行修饰,这样就会达到禁止指令重排序的效果(其实也可以通过加锁,还有一些其他已知规则来实现禁止指令重排序,但是我们这里只讨论 volatile 的实现方式)。
那么 volatile 是如何实现指令重排序的呢?
答案是:内存屏障
整理了一份 Java 面试宝典完整版 PDF,已整理成文档
内存屏障是一组 CPU 指令,用于实现对内存操作的顺序限制。 Java 编译器,会在生成指令系列时,在适当的位置会插入内存屏障来禁止处理器对指令的重新排序。
volatile 会在变量写操作的前后加入两个内存屏障,来保证前面的写指令和后面的读指令是有序的。
volatile 在变量的读操作后面插入两个指令,禁止后面的读指令和写指令重排序。
有序性,不仅只有 volatile 能保证,其他的实现方式也能保证,但是如果每一种实现方式都要了解那对于开发人员来说就比较困难了。
所以从 JDK5 就出现了 happen-before 原则,也叫先行发生原则。 先行发生原则总结起来就是:如果一个操作 A 的产生的影响能被另一个操作 B 观察到,那么可以说,这个操作 A 先行发生与操作 B。
这里所说的影响包括内存中的变量的修改,调用了方法,发送量消息等。
volatile 中的先行发生原则是,对一个 volatile 变量的写操作,先行发生于后面任何地方对这个变量的读操作。
Volatile 无法保证原子性
原子性,是指一个操作过程要么都成功,要么都失败,是一个独立的完整的。
就像上面说的,如果多个线程对一个变量进行累加,那么肯定得不到想要的结果,因为累加就不是一个原子操作。
要保证累加最终结果正确,要么对累加变量加锁,要么就用 AotomicInteger 这样的变量。
为什么要进行双重检查呢? 当第一个线程走到第一次检查时发现对象为空,然后进入锁,第二次就检查时也为空,那么就去创建对象,但是这个时候又来了一个线程来到了第一次检查,发现为空,但是这个时候因为锁被占用,所以就只能阻塞等待,然后第一个线程创建对象成功了,由于对象是被 volatile 修饰的能够立即反馈到其他线程上,所以在第一个线程释放锁之后,第二个线程进入了锁,然后进行第二次检查时,发现对象已经被创建了,那么就不在创建对象了。从而保证的单例。
还有就是如果创建对象,步骤:
分配内存空间。
调用构造器,实例化。
返回内存地址被引用。
如果这三个指令顺序被重排了,那么当多线程来获取对象的时候就会造成对象虽然实例化了,但是没有分配内存空间,会有空指针的风险。 所以加上了 volatile 的对象,也保证了在第二次检查时不会被已经在创建过程中的对象有被检测为空的风险。
总结一下
volatile 其实可以看作是轻量级的 synchronized,虽然说 volatile 不能保证原子性,但是如果在多线程下的操作本身就是原子性操作(例如赋值操作),那么使用 volatile 会由于 synchronized。
volatile 可以适用于,某个标识 flag,一旦被修改了就需要被其他线程立即可见的情况。也可以修饰作为触发器的变量,一旦变量被任何一个线程修改了,就去触发执行某个操作。
volatile 的变量写操作 happen-before,后面任何对此 volatile 变量的读操作。
作者:熬夜不加班
链接:https://juejin.cn/post/6917517239096705037
评论