剑指 Offer——JVM 基础知识点储备
一、前言
应聘后端开发岗位面试过程中,有关JVM
的问题必不可少,此篇博文主要梳理有关JVM
工作原理、收集器有关内容。
二、java 内存与内存溢出
2.1 JVM 分区及作用
程序计数器(线程私有)当前线程执行字节码的信号指示器。(每个线程都会在程序计数器中存储其指令,从而实现线程切换后恢复到正确的执行位置)
虚拟机栈(栈,线程私有)每个方法执行(开始到结束就是这个方法的生命周期)都会创建一个栈帧,栈帧存储局部变量表、操作数栈、动态链接、方法出口等信息。
(栈内存)为虚拟机执行
java
方法服务:方法被调用时创建栈帧-->局部变量表-->局部变量-->对象引用如果线程请求的栈深度超出了虚拟机所允许的深度,就会出现
StackOverFlowError. -Xss
规定了栈的最大空间;虚拟机栈可以动态扩展,如果扩展到无法申请到足够的内存,会出现
OOM
(OutOfMemoryError
)
而我们最常用的就是局部变量表,局部变量表包括如下内容:
基本数据类型:
boolean byte char short int float long double
注意基本类型的包装类型:Boolean、Byte、Character、Short、Integer、Float、Long、Double
对象引用类型:类、接口、数组 (不是对象本身,可能是一个指向对象起始地址的引用指针)
问题:包装类型是放在栈中么:String Interget
(看包装类型是怎么用的:若直接定义则内容在常量池中,若 new 一个对象则在堆中。)
本地方法栈 。与虚拟机实现的功能非常相似,不同之处在于虚拟机执行
java
方法(字节码)服务,而本地方法栈执行Native
方法服务(非java
方法写的)。java 堆。(线程共享) 虚拟机启动时创建,此内存区域的唯一目的就是存放对象实例,对象在失去引用,就会被
java
虚拟机回收。
被所有线程共享,在 java 虚拟机启动时创建,几乎所有的对象实例都存放到堆中;
GC
管理的主要区域;物理上不连续,逻辑上连续,并可以动态扩展,无法扩展时抛出
OutOfMemoryError
;
方法区(线程共享)(虚拟机把方法区叫做永久代)。用于存储已被虚拟机加载的类信息、常量、静态变量、即编译器编译后的代码等数据。
注意⚠️:特别注意静态变量
static
修饰的变量在方法区。
直接内存(了解即可)不是虚拟机运行时数据区的一部分。是
native
函数直接分配的堆外内存,这样避免了java
堆和native
堆来回复制数据。
三、垃圾收集器与内存分配策略
3.1 jvm 垃圾处理方法(标记清除、复制、标记整理)
标记—清除算法
标记阶段:先通过根节点,标记所有从根节点开始的对象,未被标记的视为垃圾对象;
清除阶段:清除所有未被标记的对象。
复制算法
将原有的内存空间分成两块,每次只使用其中一块,在垃圾回收时,将正在使用的内存中存活对象复制到未使用的内存块中,然后清除正在使用的内存块中所有对象。
标记—整理算法若对象存活率比较高,就要进行多次复制,效率比较低。
标记阶段:先通过根节点,标记所有从根节点开始的可达对象,未被标记的视为垃圾对象。
整理阶段:将所有的存活对象压缩到内存的一端(或向一端移动),之后清理边界所有的空间。
分代收集算法只是根据对象存活周期的不同将内存划分为几块。一般把 java 堆分为新生代和老年代。
新生代大量对象死亡,只有少数对象存活,采用复制算法;
老年代对象存活率高,没有额外空间对它进行分配,故采用标记-清除或标记-整理算法。
三种算法的比较:
效率:复制算法 > 标记-整理算法 > 标记-清除算法(此处的效率只是简单的对比时间复杂度)
内存整理度:复制算法 = 标记-整理算法 》标记-清除算法
内存利用率:标记-整理算法 = 标记-清除算法 》复制算法
3.2 JVM 如何 GC?新生代,老年代,持久代,都存储哪些东西,以及各个区的作用?
大多数新生的对象在Eden
区分配,当Eden
区没有足够空间进行分配时,虚拟机就会进行一次Minor GC
。(Survivor
是两个)
1. 新生代在方法中new
一个对象,方法调用完毕后,对象就会被回收,这就是一个典型的新生代对象。(新生对象在eden
区经历过一次minorGC
并且被Survivor
容纳的话,对象年龄为 1,每一次熬过MinorGc
年龄就会加 1,直到 15,就会晋升到老年。)
注意动态对象的判定:
Survivor
空间中相同年龄的对象大小总和大于Survivo
空间的一半,大于或等于该年龄的对象就可以直接进入老年代。
老年代
在新生代中经历了 N 次垃圾回收后仍然存活的对象,就会被放到老年代中,而且大对象(占用大量连续内存空间的
java
对象如很长的字符串及数组)直接进入老年代。当
survivor
空间不够用时,需要依赖老年代进行分配担保。
3.3 GC 引用可达性分析算法中 GCRoots 对象
java
虚拟机栈中的对象(引用对象);方法区中的静态成员;
方法区中的常量引用对象;
本地方法区中的
JNI
(Native
方法)引用对象 ;
3.4 MinorGC、FullGC 时机
1. MinorGC
(新生代 GC)当Eden
区没有足够空间进行分配时,虚拟机就会进行一次Minor GC
。
新生代中的垃圾收集动作,采用的是复制算法;
对于较大的对象(很长的字符串、数据、集合),在
Minor GC
的时候可以直接进入老年代。
2. FullGC
(老年代 GC)
Full GC
是发生在老年代的垃圾收集动作,采用的是标记-清除/整理算法;由于老年代的对象几乎都是在
survivor
区熬过来的,不会那么容易死掉,因此Full GC
发生的次数不会像MInor GC
那么频繁,Full GC
清理时间是Minor GC
的 10 倍。
3.5 各垃圾回收器工作原理
3.5.1 Serial 收集器
是一个单线程收集器,它“单线程”的意义并不仅仅说明它只会使用一个 cpu 或一条线程去完成垃圾回收工作。而是在收集垃圾时,暂停其他的工作线程。
新生代采用复制算法,
stop-the-world
(消除或者减少工作线程因内存回收而导致停顿)。老年代采用标记--整理算法。
简单高效,
client
模式下默认的新生代收集器。
3.5.2 ParNew 收集器
ParNew 收集器是 Serial 收集器的多线程版本;
新生代采用复制算法,
stop-the-world
;老年代采用标记--整理算法;
它是运行在
server
模式下首选新生代收集器;除了 serial 收集器之外,只能它能和 cms 收集器配合工作。
3.5.3 ParNew Scanvenge 收集器
类似 ParNew,但是更加关注吞吐量。目标是:达到一个可控制吞吐量的收集器;
停顿时间和吞吐量不可能同时调优。我们一方面希望停顿时间少,另一方面希望吞吐量高,其实这是矛盾的。因为:在
GC
的时候,垃圾回收的工作量是不变的,如果停顿时间减少,那频率就会提高;既然频率提高了,说明就会频繁的进行GC
,那吞吐量就会减少,性能就会降低。
3.5.4 G1 收集器(核心重点)
是当今收集器发展的最前沿成果之一,对垃圾回收进行划分优先级的操作,这种有优先级的区域回收方法保证了它的高效率;
最大的优点是结合了空间整合,不会产生大量的碎片,也降低了进行 GC 的频率;
让使用者明确指定停顿的时间。
3.5.5 CMS 收集器:(Concurrent Mark Sweep
:并发标记-清除 老年代收集器)
一种以获得最短回收停顿时间为目标的收集器,适用于互联网网站或者 B/S 系统的服务器上;
初始化标记(
stop-the-world
):根可以直接关联到的对象;并发标记(和用户线程一起):主要标记过程,标记全部对象;
重新标记(
stop-the-world
):由于并发标记时,用户线程依然运行,因此在正式清理前,再做修正;并发清除(和用户线程一起):基于标记结果,直接清理对象。
注意:CMS
有三个致命的问题:
cpu
资源占用;浮动的垃圾无法清除;
内存碎片;
3.6 java 引用类型
Java
有四种引用类型:
强引用:通过
new
产生的对象都是强引用。软引用:一些还有用但不是必须的对象可以使用软引用。比如创建一个软引用数组,这个数组存放了 100 多个学生对象的信息。内存比较空闲的时候这些对象和强引用没有区别,但内存紧张的时候就会被
GC
回收。(这就是 GC 的判定条件)应用软引用的好处:java
在内存不足时,程序不会崩溃;弱引用:描述非必须对象的(比软引用更弱),当
GC
工作时,无论内存是否紧张都会回收掉;当某个对象是偶尔使用,并且在使用时随时能获取,又不想影响垃圾的回收,可以考虑应用这个。虚引用:无法通过虚引用来获取对一个对象的真实引用。唯一的用处:能在对象被
GC
时收到系统通知,JAVA
中用PhantomReference
来实现虚引用。
版权声明: 本文为 InfoQ 作者【No Silver Bullet】的原创文章。
原文链接:【http://xie.infoq.cn/article/92e82b856608b0065148bf652】。文章转载请联系作者。
评论