java 开发之内存模型面试分享

作者：飞不起来的童年

2022 年 1 月 06 日
本文字数：3712 字
阅读完需：约 12 分钟

面试官：今天想跟你聊聊 Java 内存模型，这块你了解过吗？

候选者：嗯，我简单说下我的理解吧。那我就从为什么要有 Java 内存模型开始讲起吧

面试官：开始你的表演吧。

候选者：那我先说下背景吧

候选者：1. 现有计算机往往是多核的，每个核心下会有高速缓存。高速缓存的诞生是由于「CPU 与内存(主存)的速度存在差异」，L1 和 L2 缓存一般是「每个核心独占」一份的。

候选者：2. 为了让 CPU 提高运算效率，处理器可能会对输入的代码进行「乱序执行」，也就是所谓的「指令重排序」

候选者：3. 一次对数值的修改操java培训作往往是非原子性的（比如 i++实际上在计算机执行时就会分成多个指令）

候选者：在永远单线程下，上面所讲的均不会存在什么问题，因为单线程意味着无并发。并且在单线程下，编译器/runtime/处理器都必须遵守 as-if-serial 语义，遵守 as-if-serial 意味着它们不会对「数据依赖关系的操作」做重排序。

候选者：CPU 为了效率，有了高速缓存、有了指令重排序等等，整块架构都变得复杂了。我们写的程序肯定也想要「充分」利用 CPU 的资源啊！于是乎，我们使用起了多线程

候选者：多线程在意味着并发，并发就意味着我们需要考虑线程安全问题

候选者：1. 缓存数据不一致：多个线程同时修改「共享变量」，CPU 核心下的高速缓存是「不共享」的，那多个 cache 与内存之间的数据同步该怎么做？

候选者：2. CPU 指令重排序在多线程下会导致代码在非预期下执行，最终会导致结果存在错误的情况。

候选者：针对于「缓存不一致」问题，CPU 也有其解决办法，常被大家所认识的有两种：

候选者：1.使用「总线锁」：某个核心在修改数据的过程中，其他核心均无法修改内存中的数据。（类似于独占内存的概念，只要有 CPU 在修改，那别的 CPU 就得等待当前 CPU 释放）

候选者：2.缓存一致性协议（MESI 协议，其实协议有很多，只是举个大家都可能见过的）。MESI 拆开英文是（Modified （修改状态）、Exclusive （独占状态）、Share（共享状态）、Invalid（无效状态））

候选者：缓存一致性协议我认为可以理解为「缓存锁」，它针对的是「缓存行」(Cache line) 进行"加锁"，所谓「缓存行」其实就是高速缓存存储的最小单位。

面试官：嗯...

候选者：MESI 协议的原理大概就是：当每个 CPU 读取共享变量之前，会先识别数据的「对象状态」(是修改、还是共享、还是独占、还是无效)。

候选者：如果是独占，说明当前 CPU 将要得到的变量数据是最新的，没有被其他 CPU 所同时读取

候选者：如果是共享，说明当前 CPU 将要得到的变量数据还是最新的，有其他的 CPU 在同时读取，但还没被修改

候选者：如果是修改，说明当前 CPU 正在修改该变量的值，同时会向其他 CPU 发送该数据状态为 invalid(无效)的通知，得到其他 CPU 响应后（其他 CPU 将数据状态从共享(share)变成 invalid(无效)），会当前 CPU 将高速缓存的数据写到主存，并把自己的状态从 modify(修改)变成 exclusive(独占)

候选者：如果是无效，说明当前数据是被改过了，需要从主存重新读取最新的数据。

候选者：其实 MESI 协议做的就是判断「对象状态」，根据「对象状态」做不同的策略。关键就在于某个 CPU 在对数据进行修改时，需要「同步」通知其他 CPU，表示这个数据被我修改了，你们不能用了。

候选者：比较于「总线锁」，MESI 协议的"锁粒度"更小了，性能那肯定会更高咯

面试官：但据我了解，CPU 还有优化，你还知道吗？

候选者：嗯，还是了解那么一点点的。

候选者：从前面讲到的，可以发现的是：当 CPU 修改数据时，需要「同步」告诉其他的 CPU，等待其他 CPU 响应接收到 invalid(无效)后，它才能将高速缓存数据写到主存。

候选者：同步，意味着等待，等待意味着什么都干不了。CPU 肯定不乐意啊，所以又优化了一把。

候选者：优化思路就是从「同步」变成「异步」。

候选者：在修改时会「同步」告诉其他 CPU，而现在则把最新修改的值写到「store buffer」中，并通知其他 CPU 记得要改状态，随后 CPU 就直接返回干其他事了。等到收到其它 CPU 发过来的响应消息，再将数据更新到高速缓存中。

候选者：其他 CPU 接收到 invalid(无效)通知时，也会把接收到的消息放入「invalid queue」中，只要写到「invalid queue」就会直接返回告诉修改数据的 CPU 已经将状态置为「invalid」

候选者：而异步又会带来新问题：那我现在 CPU 修改完 A 值，写到「store buffer」了，CPU 就可以干其他事了。那如果该 CPU 又接收指令需要修改 A 值，但上一次修改的值还在「store buffer」中呢，没修改至高速缓存呢。

候选者：所以 CPU 在读取的时候，需要去「store buffer」看看存不存在，存在则直接取，不存在才读主存的数据。【Store Forwarding】

候选者：好了，解决掉第一个异步带来的问题了。（相同的核心对数据进行读写，由于异步，很可能会导致第二次读取的还是旧值，所以首先读「store buffer」。

面试官：还有其他？

候选者：那当然啊，那「异步化」会导致相同核心读写共享变量有问题，那当然也会导致「不同」核心读写共享变量有问题啊

候选者：CPU1 修改了 A 值，已把修改后值写到「store buffer」并通知 CPU2 对该值进行 invalid(无效)操作，而 CPU2 可能还没收到 invalid(无效)通知，就去做了其他的操作，导致 CPU2 读到的还是旧值。

候选者：即便 CPU2 收到了 invalid(无效)通知，但 CPU1 的值还没写到主存，那 CPU2 再次向主存读取的时候，还是旧值...

候选者：变量之间很多时候是具有「相关性」(a=1;b=0;b=a)，这对于 CPU 又是无感知的...

候选者：总体而言，由于 CPU 对「缓存一致性协议」进行的异步优化「store buffer」「invalid queue」，很可能导致后面的指令很可能查不到前面指令的执行结果（各个指令的执行顺序非代码执行顺序），这种现象很多时候被称作「CPU 乱序执行」

候选者：为了解决乱序问题（也可以理解为可见性问题，修改完没有及时同步到其他的 CPU），又引出了「内存屏障」的概念。

面试官：嗯...

候选者：「内存屏障」其实就是为了解决「异步优化」导致「CPU 乱序执行」/「缓存不及时可见」的问题，那怎么解决的呢？嗯，就是把「异步优化」给”禁用“掉（：

候选者：内存屏障可以分为三种类型：写屏障，读屏障以及全能屏障（包含了读写屏障），屏障可以简单理解为：在操作数据的时候，往数据插入一条"特殊的指令"。只要遇到这条指令，那前面的操作都得「完成」。

候选者：那写屏障就可以这样理解：CPU 当发现写屏障的指令时，会把该指令「之前」存在于「store Buffer」所有写指令刷入高速缓存。

候选者：通过这种方式就可以让 CPU 修改的数据可以马上暴露给其他 CPU，达到「写操作」可见性的效果。

候选者：那读屏障也是类似的：CPU 当发现读屏障的指令时，会把该指令「之前」存在于「invalid queue」所有的指令都处理掉

候选者：通过这种方式就可以确保当前 CPU 的缓存状态是准确的，达到「读操作」一定是读取最新的效果。

候选者：由于不同 CPU 架构的缓存体系不一样、缓存一致性协议不一样、重排序的策略不一样、所提供的内存屏障指令也有差异，为了简化 Java 开发人员的工作。Java 封装了一套规范，这套规范就是「Java 内存模型」

候选者：再详细地说，「Java 内存模型」希望屏蔽各种硬件和操作系统的访问差异，保证了 Java 程序在各种平台下对内存的访问都能得到一致效果。目的是解决多线程存在的原子性、可见性（缓存一致性）以及有序性问题。

面试官：那要不简单聊聊 Java 内存模型的规范和内容吧？

候选者：不了，怕一聊就是一个下午，下次吧？

本文总结：

并发问题产生的三大根源是「可见性」「有序性」「原子性」
可见性：CPU 架构下存在高速缓存，每个核心下的 L1/L2 高速缓存不共享（不可见）
有序性：主要有三方面可能导致打破编译器优化导致重排序（编译器可以在不改变单线程程序语义的情况下，可以对代码语句顺序进行调整重新排序）指令集并行重排序（CPU 原生就有可能将指令进行重排）内存系统重排序（CPU 架构下很可能有 store buffer /invalid queue 缓冲区，这种「异步」很可能会导致指令重排）
原子性：Java 的一条语句往往需要多条 CPU 指令完成(i++)，由于操作系统的线程切换很可能导致 i++ 操作未完成，其他线程“中途”操作了共享变量 i ，导致最终结果并非我们所期待的。
在 CPU 层级下，为了解决「缓存一致性」问题，有相关的“锁”来保证，比如“总线锁”和“缓存锁”。总线锁是锁总线，对共享变量的修改在相同的时刻只允许一个 CPU 操作。缓存锁是锁缓存行(cache line)，其中比较出名的是 MESI 协议，对缓存行标记状态，通过“同步通知”的方式，来实现(缓存行)数据的可见性和有序性但“同步通知”会影响性能，所以会有内存缓冲区(store buffer/invalid queue)来实现「异步」进而提高 CPU 的工作效率引入了内存缓冲区后，又会存在「可见性」和「有序性」的问题，平日大多数情况下是可以享受「异步」带来的好处的，但少数情况下，需要强「可见性」和「有序性」，只能"禁用"缓存的优化。 “禁用”缓存优化在 CPU 层面下有「内存屏障」，读屏障/写屏障/全能屏障，本质上是插入一条"屏障指令"，使得缓冲区(store buffer/invalid queue)在屏障指令之前的操作均已被处理，进而达到读写在 CPU 层面上是可见和有序的。
不同的 CPU 实现的架构和优化均不一样，Java 为了屏蔽硬件和操作系统访问内存的各种差异，提出了「Java 内存模型」的规范，保证了 Java 程序在各种平台下对内存的访问都能得到一致效果

文章来源于 IT 大咖说

发布于: 刚刚

飞不起来的童年

关注

关注尚硅谷，轻松学IT 2021.11.23 加入

还未添加个人简介

发布

暂无评论

创作场景

java 开发之内存模型面试分享

飞不起来的童年

评论