写点什么

Java 内存模型 (JMM) 详解

用户头像
云流
关注
发布于: 2021 年 01 月 21 日

一、为什么要有内存模型


  • 在现代多核处理器中,每个处理器都有自己的缓存,需要定期的与主内存进行协调。

  • 想要确保每个处理器在任意时刻知道其他处理器正在进行的工作,将需要很大的开销,且通常是没必要的。


1.1 硬件的效率与一致性


1、 由于计算机的存储设备与处理器的运算能力之间有几个数量级的差距,所以现代计算机系统都不得不加入一层读写速度尽可能接近处理器运算速度的高速缓存(cache)来作为内存与处理器之间的缓冲:将运算需要使用到的数据复制到缓存中,让运算能快速进行,当运算结束后再从缓存同步回内存之中没这样处理器就无需等待缓慢的内存读写了。


2、多个处理器运算任务都涉及同一块主存,需要一种协议可以保障数据的一致性,这类协议有 MSI、MESI、MOSI 及 Dragon Protocol 等。Java 虚拟机内存模型中定义的内存访问操作与硬件的缓存访问操作是具有可比性的。


3、基于高速缓存的存储交互很好地解决了处理器与内存的速度矛盾,但是引入了一个新的问题: 缓存一致性(Cache Coherence)。在多处理器系统中,每个处理器都有自己的高速缓存,而他们又共享同一主存,下面会介绍这个问题

image

二、CPU 和缓存一致性


2.1 为什么需要 CPU cache


因为 CPU 的频率太快了,快到主存跟不上,这样在处理器时钟周期内,CPU 常常需要等待主存,浪费资源。CPU 往往需要重复处理相同的数据、重复执行相同的指令,如果这部分数据、指令 CPU 能在 CPU 缓存中找到,CPU 就不需要从内存或硬盘中再读取数据、指令,从而减少了整机的响应时间,所以 cache 的出现,是为了缓解 CPU 和内存之间速度的不匹配问题( 结构:cpu -> cache -> memory )


image


在程序执行的过程中就变成了:


当程序在运行过程中,会将运算需要的数据从主存复制一份到CPU的高速缓存当中,那么CPU进行计算时
复制代码

在 Intel 官网上产品-处理器界面内对缓存的定义为:CPU 高速缓存是处理器上的一个快速记忆区域。英特尔智能高速缓存(SmartCache)是指可让所有内核动态共享最后一级高速缓存的架构。这里就提及到了最后一级高速缓存的概念,即为 CPU 缓存中的 L3(三级缓存) ,那么我们继续来解释一下什么叫三级缓存,分别又是指哪三级缓存。


image

2.2 三级缓存(L1、L2、L3)


  1. 三级缓存( L1 一级缓存、L2 二级缓存、L3 三级缓存 )都是集成在 CPU 内的缓存 2) 它们的作用都是作为 CPU 与主内存之间的高速数据缓冲区 3) L1 最靠近 CPU 核心,L2 其次,L3 再次 运行速度方面: L1 最快、L2 次快、L3 最慢


容量大小方面: L1 最小、L2 较大、L3 最大


  1. CPU 会先在最快的 L1 中寻找需要的数据,找不到再去找次快的 L2,还找不到再去找 L3,L3 都没有那就只能去内存找了。

  2. 单核 CPU 只含有一套 L1,L2,L3 缓存;如果 CPU 含有多个核心,即多核 CPU,则每个核心都含有一套 L1(甚至和 L2)缓存,而共享 L3(或者和 L2)缓存。


单 CPU 双核的缓存结构:

image

在单线程环境下,cpu 核心的缓存只被一个线程访问。缓存独占,不会出现访问冲突等问题 在多线程场景下,在 CPU 和主存之间增加缓存,就可能存在 缓存一致性问题 ,也就是说,在多核 CPU 中,每个核的自己的缓存中,关于同一个数据的缓存内容可能不一致,这也就是我们上面提到的 缓存一致性的问题


image

2.3 乱序执行优化


从 java 源码到最终实际执行的指令序列,会经历下面 3 种重排序:

image

重排序的现象:


  • a=10,b=a 这一组 b 依赖 a,不会重排序

  • a=10,b=50 这一组 a 和 b 没有关系,那么就有可能被重排序执行 b=50,a=10


  • image


三、java 内存模型


Java 内存模型即 Java Memory Model,简称 JMM。JMM 定义了 Java 虚拟机(JVM)在计算机内存(RAM)中的工作方式。JVM 是整个计算机虚拟模型,所以 JMM 是隶属于 JVM 的。


Java 内存模型(Java Memory Model ,JMM)就是一种符合内存模型规范的,屏蔽了各种硬件和操作系统的访问差异的,保证了 Java 程序在各种平台下对内存的访问都能保证效果一致的机制及规范。可以避免像 c++等直接使用物理硬件和操作系统的内存模型在不同操作系统和硬件平台下表现不同,比如有些 c/c++程序可能在 windows 平台运行正常,而在 linux 平台却运行有问题。


Java 线程之间的通信采用的是过共享内存模型,这里提到的共享内存模型指的就是 Java 内存模型(简称 JMM),JMM 决定一个线程对共享变量的写入何时对另一个线程可见。从抽象的角度来看,JMM 定义了线程和主内存之间的抽象关系:线程之间的共享变量存储在主内存(main memory)中,每个线程都有一个私有的本地内存(local memory),本地内存中存储了该线程以读/写共享变量的副本。本地内存是 JMM 的一个抽象概念,并不真实存在。它涵盖了缓存,写缓冲区,寄存器以及其他的硬件和编译器优化。

image

从上图来看,线程 A 与线程 B 之间如要通信的话,必须要经历下面 2 个步骤:


  1. 线程 A 把本地内存 A 中更新过的共享变量刷新到主内存中去。

  2. 线程 B 到主内存中去读取线程 A 之前已更新过的共享变量。


具体示意图:

image

如上图所示,本地内存 A 和 B 有主内存中共享变量 z 的副本。假设初始时,这三个内存中的 z 值都为 0。线程 A 在执行时,把更新后的 z 值(假设值为 1)临时存放在自己的本地内存 A 中。当线程 A 和线程 B 需要通信时,线程 A 首先会把自己本地内存中修改后的 z 值刷新到主内存中,此时主内存中的 z 值变为了 1。随后,线程 B 到主内存中去读取线程 A 更新后的 z 值,此时线程 B 的本地内存的 z 值也变为了 1。


从整体来看,这两个步骤实质上是线程 A 在向线程 B 发送消息,而且这个通信过程必须要经过主内存。JMM 通过控制主内存与每个线程的本地内存之间的交互,来为 java 程序员提供内存可见性保证。


3.1 JVM 对 Java 内存模型的实现


在 JVM 内部,Java 内存模型把 Java 虚拟机内部划分为: 线程栈和堆


image


线程栈:


每一个运行在 Java 虚拟机里的线程都拥有自己的线程栈。这个线程栈包含了这个线程调用的方法当前执行点相关的信息。一个线程仅能访问自己的线程栈。一个线程创建的本地变量对其它线程不可见,仅自己可见。即使两个线程执行同样的代码,这两个线程任然在在自己的线程栈中的代码来创建本地变量。因此,每个线程拥有每个本地变量的独有版本。


线程堆:


堆上包含在 Java 程序中创建的所有对象,无论是哪一个对象创建的。这包括原始类型的对象版本。如果一个对象被创建然后赋值给一个局部变量,或者用来作为另一个对象的成员变量,这个对象任然是存放在堆上。


  • 一个本地变量如果是原始类型,那么它会被完全存储到栈区

  • 一个本地变量也有可能是一个对象的引用,这种情况下,这个本地引用会被存储到栈中,但是对象本身仍然存储在堆区

  • 对于一个对象的成员方法,这些方法中包含本地变量,仍需要存储在栈区,即使它们所属的对象在堆区

  • 对于一个对象的成员变量,不管它是原始类型还是包装类型,都会被存储到堆区

  • Static 类型的变量以及类本身相关信息都会随着类本身存储在堆区

  • 堆中的对象可以被多线程共享。如果一个线程获得一个对象的应用,它便可访问这个对象的成员变量。如果两个线程同时调用了同一个对象的同一个方法,那么这两个线程便可同时访问这个对象的成员变量,但是对于本地变量,每个线程都会拷贝一份到自己的线程栈中


3.2 Java 内存模型和硬件架构之间的桥接


Java 内存模型和硬件内存架构并不一致。硬件内存架构中并没有区分栈和堆,从硬件上看,不管是栈还是堆,大部分数据都会存到主存中,当然一部分栈和堆的数据也有可能会存到 CPU 寄存器中,如下图所示,Java 内存模型和计算机硬件内存架构是一个交叉关系:

image

3.3 Java 内存模型 - 同步八种操作


  1. lock(锁定):作用于主内存的变量,把一个变量标识为一条线程独占状态 2) unock(解锁):作用于主内存的变量,把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定 3) read(读取):作用于主内存的变量,把一个变量值从主内存传输到线程的工作内存中,以便随后的 load 动作使用 4) load(载入):作用于工作内存的变量,它把 read 操作从主内存中得到的变量值放入工作内存的变量副本中 5) use(使用):作用于工作内存的变量,把工作内存中的一个变量值传递给执行引擎 6) assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收到的值赋值给工作内存的变量 7) store(存储):作用于工作内存的变量,把工作内存中的一个变量的值传送到内存中,以便随后的 write 的操作 8) write(写入):作用于工作内存的变量,它把 store 操作从工作内存中一个变量的值传送到主内存的变量中


3.4 Java 内存模型 - 同步规则


  • 如果要把一个变量从主内存中复制到工作内存,就需要按顺序地执行 read 和 load 操作,如果把变量从工作内存中同步回主内存中,就要按顺序地执行 store 和 write 操作。但 Java 内存模型只要求上诉操作必须按顺序执行,而没有保证必须是连续执行

  • 不允许 read 和 load、store 和 write 操作之一单独出现

  • 不允许一个线程丢弃它的最近 assign 的操作,即变量在工作内存中改变了之后必须同步到主内存中

  • 不允许一个线程无原因的(没有发生过任何 assign 操作)把数据从工作内存同步回主内存中

  • 一个新的变量只能在主内存中诞生,不允许在工作内存中直接使用一个未被初始化(load 或 assign)的变量。即就是对一个变量实施 use 和 store 操作之前,必须先执行过了 assign 和 load 操作

  • 一个变量在同一时刻只允许一条线程对其进行 lock 操作,但 lock 操作可以被同一条线程重复执行多次,多次执行 lock 后,只有执行相同次数的 unlock 操作,变量才会解锁。lock 和 unlock 必须成对出现

  • 如果对一个变量执行 lock 操作,将会清空工作内存中此变量的值,在执行引擎使用这个变量前需要重新执行 load 或 assign 操作初始化变量的值

  • 如果一个变量事先没有被 lock 操作锁定,则不允许对它执行 unlock 操作,也不允许去 unlock 一个被其他线程锁定的变量

  • 对一个变量执行 unlock 操作之前,必须先把此变量同步到主内存中(执行 store 和 write 操作)


image

原子性、可见性、有序性:可以查看我上一篇文章:线程安全性详解(原子性、可见性、有序性)


四、并发的优势与风险


优势:1) 速度:使用处理多个请求,响应更快,复杂的操作可以分成多个进程同时执行 2) 设计:程序设计在某些情况下更简单,也可以有更多的选择 3) 资源利用:CPU 能够在等待 IO 的时候做一些其他的事情


风险:1) 安全性:多个线程共享数据时可能会产生于期望不相符的结果 2) 活跃性:某个操作无法继续进行下去时,就会发生活跃性问题。比如死锁、饥饿等问题 3) 性能:线程过多时会使得:CPU 频繁切换,调度时间增多;同步机制;消耗过多内存

image

五、总结


CPU 多级缓存:缓存一致性、乱序执行优化 Java 内存模型:JMM 规定、抽象结构、同步八种操作及规则 Java 并发的优势与风险


原文:https://www.tuicool.com/articles/YjyummM


用户头像

云流

关注

还未添加个人签名 2020.09.02 加入

还未添加个人简介

评论

发布
暂无评论
Java内存模型(JMM)详解