又是一年金九银十,不明白 JVM 虚拟机还怎么面试 -,kafka 部署架构
* 两个 Survivor 区可解决内存碎片化 #### **1.2.2 堆栈相关的参数** | 参数 | 描述 | | --- | --- | | -Xms | 堆内存初始大小,单位 m、g | | -Xmx | 堆内存最大允许大小,一般不要大于物理内存的 80% | | -Xmn | 年轻代内存初始大小 | | -Xss | 每个线程的堆栈大小,即 JVM 栈的大小 | | -XX:NewRatio | 年轻代(包括 Eden 和两个 Survivor 区)与年老代的比值 | | -XX:NewSzie(-Xns) | 年轻代内存初始大小,可以缩写-Xns | | -XX:MaxNewSize(-Xmx) | 年轻代内存最大允许大小,可以缩写-Xmx | | -XX:SurvivorRatio | 年轻代中 Eden 区与 Survivor 区的容量比例值,默认为 8,即 8:1 | | -XX:MinHeapFreeRatio | GC 后,如果发现空闲堆内存占到整个预估堆内存的 40%,则放大堆内存的预估最大值,但不超过固定最大值。 | | -XX:MaxHeapFreeRatio | 预估堆内存是堆大小动态调控的重要选项之一。堆内存预估最大值一定小于或等于固定最大值(-Xmx 指定的数值)。前者会根据使用情况动态调大或缩小,以提高 GC 回收的效率,默认 70% | | -XX:MaxTenuringThreshold | 垃圾最大年龄,设置为 0 的话,则年轻代对象不经过 Survivor 区,直接进入年老代。对于年老代比较多的应用,可以提高效率.如果将此值设置为一个较大值,则年轻代对象会在 Survivor 区进行多次复制,这样可以增加对象再年轻代的存活 时间,增加在年轻代即被回收的概率 | | -XX:InitialTenuringThreshold | 可以设定老年代阀值的初始值 | | -XX:+PrintTenuringDistribution | 查看每次 minor GC 后新的存活周期的阈值 | **Note:**?每次 GC 后会调整堆的大小,为了**防止动态调整带来的性能损耗**,一般设置-**Xms、-Xmx 相等**。 新生代的三个设置参数:-Xmn,-XX:NewSize,-XX:NewRatio 的优先级: 1).最高优先级:?-XX:NewSize=1024m 和-XX:MaxNewSize=1024m 2).次高优先级:?-Xmn1024m ?(默认等效效果是:-XX:NewSize==-XX:MaxNewSize==1024m) 3).最低优先级:-XX:NewRatio=2 推荐使用的是-Xmn 参数,原因是这个参数很简洁,相当于一次性设定 NewSize 和 MaxNewSIze,而且两者相等。 ### **1.3 jvm 对象** #### **1.3.1 创建对象的方式** ![](https://static001.geekbang.org/infoq/dc/dc5042f412cacdb7b721bf2e3451282d.png) 各个方式的实质操作如下: | 方式 | 实质 | | --- | --- | | 使用 new 关键 | 调用无参或有参构造器函数创建 | | 使用 Class 的 newInstance 方法 | 调用无参或有参构造器函数创建,且需要是 publi 的构造函数 | | 使用 Constructor 类的 newInstance 方法 | 调用有参和私有 private 构造器函数创建,实用性更广 | | 使用 Clone 方法 | 不调用任何参构造器函数,且对象需要实现 Cloneable 接口并实现其定义的 clone 方法,且默认为浅复制 | | 第三方库 Objenesis | 利用了 asm 字节码技术,动态生成 Constructor 对象 | #### **1.3.2 jvm 对象分配** 在虚拟机层面上创建对象的步骤: ![](https://static001.geekbang.org/infoq/d7/d7f427398902e6db6da7248c564bfc8b.png) | 步骤 | 解析 | | --- | --- | | 1、判断对象对应的类是否加载、链接、初始化 | 虚拟机遇到一条 new 指令,首先去检查这个指令的参数能否在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化。如果没有,那么必须先执行类的加载、解释、初始化(类的 clinit 方法)。 | | 2、为对象分配内存 | 类加载检查通过后,虚拟机为新生对象分配内存。对象所需内存大小在类加载完成后便可以完全确定,为对象分配空间无非就是从 Java 堆中划分出一块确定大小的内存而已。 | | 3、处理并发安全问题 | 另外一个问题及时保证 new 对象时候的线程安全性:创建对象是非常频繁的操作,虚拟机需要解决并发问题。?虚拟机采用了两种方式解决并发问题: (1)CAS 配上失败重试的方式保证指针更新操作的原子性; (2)TLAB 把内存分配的动作按照线程划分在不同的空间之中进行,即每个线程在 Java 堆中预先分配一小块内存,称为本地线程分配缓冲区,(TLAB ,Thread Local Allocation Buffer)虚拟机是否使用 TLAB,可以通过-XX:+/-UseTLAB 参数来设定。 | | 4、初始化分配到的空间 | 内存分配结束,虚拟机将分配到的内存空间都初始化为零值(不包括对象头)。这一步保证了对象的实例字段在 Java 代码中可以不用赋初始值就可以直接使用,程序能访问到这些字段的数据类型所对应的零值 | | 5、设置对象的对象头 | 将对象的所属类(即类的元数据信息)、对象的 HashCode 和对象的 GC 分代年龄等数据存储在对象的对象头中 | | 6、执行 init 方法进行初始化 | 在 Java 程序的视角看来,初始化才正式开始,开始调用方法完成初始赋值和构造函数,所有的字段都为零值。因此一般来说(由字节码中是否跟随有 invokespecial 指令所决定),new 指令之后会接着就是执 行方法,把对象按照程序员的意愿进行初始化,这样一个真正可用的对象才算完全创建出来。 | **1.3.3 对象分配内存方式** **分配对象内存**,**有两种分配方式**,**指针碰撞**和**空闲列表**: 1)如果内存是规整的,那么虚拟机将采用的是指针碰撞法(Bump The Pointer)来为对象分配内存。意思是所有用过的内存在一边,空闲的内存在另外一边,中间放着一个指针作为分界点的指示器,分配内存就仅仅是把指针向空闲那边挪动一段与对象大小相等的距离罢了。如果垃圾收集器选择的是 Serial、ParNew 这种基于压缩算法的,虚拟机采用这种分配方式。一般使用带有 compact(整理)过程的收集器时,使用指针碰撞。 2)如果内存不是规整的,已使用的内存和未使用的内存相互交错,那么虚拟机将采用的是空闲列表法来为对象分配内存。意思是虚拟机维护了一个列表,记录上哪些内存块是可用的,再分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的内容。这种分配方式成为“空闲列表(Free List)”。 **Note:**?选择哪种分配方式由 Java 堆是否规整决定,而 Java 堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。 #### **1.3.4 那什么样的对象能够进入老年代(Old)** ![](https://static001.geekbang.org/infoq/3b/3bee3b085b72890092caeb8d40842d95.png) ### **1.4 内存分配与回收策略** 1. ## ?对象优先在 Eden 分配,大多数情况下,对象在新生代 Eden 区中分配,当 Eden 区没有足够的空间进行分配时,虚拟机将发起一次 Minor GC;虚拟机提供了-XX:PrintGCDetails 参数,发生垃圾回收时打印内存回收日志,并且在进程退出时输出当前内存各区域的分配情况。 2. ## 大对象直接进入老年代,所谓的大对象就是指,需要大量连续内存空间的 java 对象,最典型的大对象就是那种很长的字符串及数组。虚拟机提供了一个-XX:PretenureSizeThreshold 参数,令大于这个设置值得对象直接在老年代中分配(这样做的目的是避免在 Eden 区及两个 Survivor 之间发生大量的内存拷贝) 3. 长期存活的对象将直接进入老年代,对象年龄计数器。-XX:MaxTenuringThreshold 4. 动态对象年龄判定,虚拟机并不总是要求对象的年龄必须达到 MaxTenuringThreshold 才能晋升老年代,如果在 Survivor 空间中相同年龄所有对象大小的总和大于 Survivor 空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无需等到 MaxTenuringThreshold 中要求的年龄 5. 空间分配担保,在发生 Minor GC 时(前),虚拟机会检测之前每次晋升到老年代的平均大小(因为当次会有多少对象会存活是无法确定的,所以取之前的平均值/经验值)是否大于老年代的剩余空间大小,如果大于,则改为直接进行一次 Full GC。如果小于,则查看 HandlePromotionFailure 设置是否允许担保失败;如果允许,那只会进行 Minor GC;如果不允许,则也要改为进行一次 Full GC。取平均值进行比较其实仍然是一种动态概率手段,也就是说如果某次 Minor GC 存活后的对象突增,远远高于平均值的话,依然会导致担保失败(Handle Promotion Failure),这样会触发 Full GC。 ## **2.1 引用二 垃圾回收算法分类** ![](https://static001.geekbang.org/infoq/9b/9bee916a6f074efc8e9546c36660295c.jpeg) ### **2.2 GC Root 的对象** ![](https://static001.geekbang.org/infoq/7c/7c7b3f76f047fa270f0f1cf205ca360b.png) ### **2.3 标记-清除(Mark—Sweep)** 被誉为现代垃圾回收算法的思想基础。 ![](https://static001.geekbang.org/infoq/0f/0f5d071dd43054527963941c7aded55c.png) **标记-清除算法**采用从根集合进行扫描,对存活的对象对象标记,标记完毕后,再扫描整个空间中未被标记的对象,进行回收,如上图所示。标记-清除算法不需要进行对象的移动,并且仅对不存活的对象进行处理,在存活对象比较多的情况下极为高效,但由于标记-清除算法直接回收不存活的对象,因此会造成内存碎片。 ### **2.4 复制算法(Copying)** 该算法的提出是为了克服句柄的开销和解决堆碎片的垃圾回收。建立在存活对象少,垃圾对象多的前提下。此算法每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去后还能进行相应的内存整理,不会出现碎片问题。但缺点也是很明显,就是需要两倍内存空间。 ![](https://static001.geekbang.org/infoq/76/763a723a2a506cbaefe804b51524206a.png) 它开始时把堆分成 一个对象 面和多个空闲面, 程序从对象面为对象分配空间,当对象满了,基于 copying 算法的垃圾 收集就从根集中扫描活动对象,并将每个活动对象复制到空闲面(使得活动对象所占的内存之间没有空闲洞),这样空闲面变成了对象面,原来的对象面变成了空闲面,程序会在新的对象面中分配内存。一种典型的基于 coping 算法的垃圾回收是 stop-and-copy 算法,它将堆分成对象面和空闲区域面,在对象面与空闲区域面的切换过程中,程序暂停执行。 ### **2.5 标记-整理(或标记-压缩算法,Mark-Compact,又或者叫标记清除压缩 MarkSweepCompact)** 此算法是结合了“标记-清除”和“复制算法”两个算法的优点。避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问题。 ![](https://static001.geekbang.org/infoq/54/54f4d67a810690665e6e12bb6ac4fdcf.png) 标记-整理算法采用标记-清除算法一样的方式进行对象的标记,但在清除时不同,在回收不存活的对象占用的空间后,会将所有的存活对象往左端空闲空间移动,并更新对应的指针。标记-整理算法是在标记-清除算法的基础上,又进行了对象的移动,因此成本更高,但是却解决了内存碎片的问题。在基于 Compacting 算法的收集器的实现中,一般增加句柄和句柄表。 ### **2.6 分代回收策略(Generational Collecting)** 基于这样的事实:不同的对象的生命周期是不一样的。因此,不同生命周期的对象可以采取不同的回收算法,以便提高回收效率。 新生代由于其对象存活时间短,且需要经常 gc,因此采用效率较高的复制算法,其将内存区分为一个 eden 区和两个 suvivor 区,默认 eden 区和 survivor 区的比例是 8:1,分配内存时先分配 eden 区,当 eden 区满时,使用复制算法进行 gc,将存活对象复制到一个 survivor 区,当一个 survivor 区满时,将其存活对象复制到另一个区中,当对象存活时间大于某一阈值时,将其放入老年代。老年代和永久代因为其存活对象时间长,因此使用标记清除或标记整理算法 **总结:** * 新生代:复制算法(新生代回收的频率很高,每次回收的耗时很短,为了支持高频率的新生代回收,虚拟机可能使用一种叫做卡表(Card Table)的数据结构,卡表为一个比特位集合,每个比特位可以用来表示老年代的某一区域中的所有对象是否持有新生代对, ### **2.7 垃圾回收器** ![](https://static001.geekbang.org/infoq/6f/6f13d010295bec29e42cd48285c303c8.jpeg) **垃圾回收器**的任务是识别和回收垃圾对象进行内存清理,不同代可使用不同的收集器: * **新生代收集器**使用的收集器:**Serial、ParNew、Parallel Scavenge**; * **老年代收集器**使用的收集器:**Serial Old(MSC)、Parallel Old、CMS。** **总结:** 1. **Serial old 和新生代的所有回收器都能搭配;****也可以作为 CMS 回收器的备用回收器;** 2. **CMS 只能和新生代的 Serial 和 ParNew 搭配,而且 ParNew 是 CMS 默认的新生代回收器;** 3. **并行(Parallel):****指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态** 4. **并发(Concurrent):****指用户线程和垃圾收集线程同时执行(但不一定是并行的,可能是交替执行),用户程序继续运行,而垃圾收集程序运行在另外的 CPU 上。** ## **三. GC 的执行机制** Java 中的**堆(deap)**?也是 GC 收集垃圾的主要区域。由于对象进行了分代处理,因此垃圾回收区域、时间也不一样。GC 有两种类型:**Scavenge GC(Minor GC)**和**Full GC(Major GC):** * **Scavenge GC(Minor GC):**?一般情况下,当新对象生成(age=0),并且在 Eden 申请空间失败时,就会触发 Scavenge GC,对 Eden 区域进行 GC,清除非存活对象,并且把尚且存活的对象移动到 Survivor 区(age+1)。然后整理(其实是复制过去就顺便整理了)Survivor 的两个区。这种方式的 GC 是对年轻代的 Eden 区进行,不会影响到年老代。因为大部分对象都是从 Eden 区开始的,同时 Eden 区不会分配的很大,所以 Eden 区的 GC 会频繁进行。因而,一般在这里需要使用速度快、效率高的算法(即复制-清理算法),使 Eden 去能尽快空闲出来。Java 中的大部分对象通常不需长久存活,具有朝生夕灭的性质。 * **Full GC:**对整个堆进行整理,包括 Young、Tenured 和 Perm。Full GC 因为需要对整个对进行回收,所以比 Scavenge GC 要慢,因此应该尽可能减少 Full GC 的次数。在对 JVM 调优的过程中,很大一部分工作就是对于 FullGC 的调节。 ### **3.1 触发 Full GC 执行的场景** ![](https://static001.geekbang.org/infoq/f3/f33a807ff06600328ffb6d44fa3670bd.jpeg) ### **3.2 Young GC 触发条件** ![](https://static001.geekbang.org/infoq/d2/d2dd8a0e0edef40a5f5fde69fe3f3073.jpeg) ### **3.3 新生对象 GC 收回流程** 基于大多数新生对象都会在 GC 中被收回的假设。新生代的 GC 使用复制算法,(将年轻代分为 3 部分,主要是为了生命周期短的对象尽量留在年轻代。老年代主要存放生命周期比较长的对象,比如缓存)。可能经历过程: 1. **对象创建时,一般在 Eden 区完成内存分配(有特殊);** 2. **当 Eden 区满了,再创建对象,会因为申请不到空间,触发 minorGC,进行 young(eden+1survivor)区的垃圾回收;** 3. **minorGC 时,Eden 和 survivor A 不能被 GC 回收且年龄没有达到阈值(tenuring threshold)的对象,会被放入 survivor B,始终保证一个 survivor 是空的;** 4. **当做第 3 步的时候,如果发现 survivor 满了,将这些对象 copy 到 old 区(分配担保机制);****或者 survivor 并没有满,但是有些对象已经足够 Old,也被放入 Old 区 XX:MaxTenuringThreshold;(回顾下对象进入老年代的情况)** 5. **直接清空 eden 和 survivor A;** 6. **当 Old 区被放满的之后,进行 fullGC。** ### 3.4 GC 日志 **GC 日志相关参数:** * -XX:+PrintGC:输出 GC 日志 * -XX:+PrintGCDetails:输出 GC 的详细日志 * -XX:+Pri ``` 【一线大厂 Java 面试题解析+核心总结学习笔记+最新架构讲解视频+实战项目源码讲义】 浏览器打开:qq.cn.hn/FTf 免费领取 ``` ntGCTimeStamps:输出 GC 的时间戳(以基准时间的形式) * -XX:+PrintGCApplicationStoppedTime:打印垃圾回收期间程序暂停的时间 * -XX:+PrintGCApplicationConcurrentTime:打印每次垃圾回收前,程序未中断的执行时间 * -XX:+PrintHeapAtGC:在进行 GC 的前后打印出堆的信息 * -XX:+PrintTLAB:查看 TLAB 空间的使用情况 * -XX:PrintTenuingDistribution:查看每次 minor GC 后新的存活周期的阈值 * -XX:PrintReferenceFC:用来跟踪系统内的(softReference)软引用,(weadReference)弱引用,(phantomReference)虚引用,显示引用过程 案例分析:
评论