写点什么

快醒醒吧!互联网大厂面试必问的 JVM 底层原理,你还搞不清楚

用户头像
极客good
关注
发布于: 刚刚

二、 发现虚拟机频繁 full GC 时应该怎么办:(full GC 指的是清理整个堆空间,包括年轻代和永久代)(1) 首先用命令查看触发 GC 的原因是什么 jstat –gccause 进程 id(2) 如果是 System.gc(),则看下代码哪里调用了这个方法(3) 如果是 heap inspection(内存检查),可能是哪里执行 jmap –histo[:live]命令(4) 如果是 GC locker,可能是程序依赖的 JNI 库的原因


三、常见的垃圾回收算法:1、Mark-Sweep(标记-清除算法):(1)思想:标记清除算法分为两个阶段,标记阶段和清除阶段。标记阶段任务是标记出所有需要回收的对象,清除阶段就是清除被标记对象的空间。(2)优缺点:实现简单,容易产生内存碎片 2、Copying(复制清除算法):(1)思想:将可用内存划分为大小相等的两块,每次只使用其中的一块。当进行垃圾回收的时候了,把其中存活对象全部复制到另外一块中,然后把已使用的内存空间一次清空掉。(2)优缺点:不容易产生内存碎片;可用内存空间少;存活对象多的话,效率低下。3、Mark-Compact(标记-整理算法):(1)思想:先标记存活对象,然后把存活对象向一边移动,然后清理掉端边界以外的内存。(2)优缺点:不容易产生内存碎片;内存利用率高;存活对象多并且分散的时候,移动次数多,效率低下


4、分代收集算法:(目前大部分 JVM 的垃圾收集器所采用的算法):


思想:把堆分成新生代和老年代。(永久代指的是方法区)


(1) 因为新生代每次垃圾回收都要回收大部分对象,所以新生代采用 Copying 算法。新生代里面分成一份较大的 Eden 空间和两份较小的 Survivor 空间。每次只使用 Eden 和其中一块 Survivor 空间,然后垃圾回收的时候,把存活对象放到未使用的 Survivor(划分出 from、to)空间中,清空 Eden 和刚才使用过的 Survivor 空间。(2) 由于老年代每次只回收少量的对象,因此采用 mark-compact 算法。(3) 在堆区外有一个永久代。对永久代的回收主要是无效的类和常量 5、GC 使用时对程序的影响?垃圾回收会影响程序的性能,Java 虚拟机必须要追踪运行程序中的有用对象,然后释放没用对象,这个过程消耗处理器时间 6、几种不同的垃圾回收类型:(1)Minor GC:从年轻代(包括 Eden、Survivor 区)回收内存。


A、当 JVM 无法为一个新的对象分配内存的时候,越容易触发 Minor GC。所以分配率越高,内存越来越少,越频繁执行 Minor GCB、执行 Minor GC 操作的时候,不会影响到永久代(Tenured)。从永久代到年轻代的引用,被当成 GC Roots,从年轻代到老年代的引用在标记阶段直接被忽略掉。


(2)Major GC:清理整个老年代,当 eden 区内存不足时触发。(3)Full GC:清理整个堆空间,包括年轻代和老年代。当老年代内存不足时触发

HotSpot 虚拟机详解:

1、 Java 对象创建过程:(1)虚拟机遇到一条 new 指令时,首先检查这个指令的参数能否在常量池中定位到一个类的符号引用,并检查这个符号引用代表的类是否已经加载、连接和初始化。如果没有,就执行该类的加载过程。(2)为该对象分配内存。A、假设 Java 堆是规整的,所有用过的内存放在一边,空闲的内存放在另外一边,中间放着一个指针作为分界点的指示器。那分配内存只是把指针向空闲空间那边挪动与对象大小相等的距离,这种分配称为“指针碰撞”B、假设 Java 堆不是规整的,用过的内存和空闲的内存相互交错,那就没办法进行“指针碰撞”。虚拟机通过维护一个列表,记录哪些内存块是可用的,在分配的时候找出一块足够大的空间分配给对象实例,并更新表上的记录。这种分配方式称为“空闲列表“。C、使用哪种分配方式由 Java 堆是否规整决定。Java 堆是否规整由所采用的垃圾收集器是否带有压缩整理功能决定。D、分配对象保证线程安全的做法:虚拟机使用 CAS 失败重试的方式保证更新操作的原子性。(实际上还有另外一种方案:每个线程在 Java 堆中预先分配一小块内存,称为本地线程分配缓冲,TLAB。哪个线程要分配内存,就在哪个线程的 TLAB 上分配,只有 TLAB 用完并分配新的 TLAB 时,才进行同步锁定。虚拟机是否使用 TLAB,由-XX:+/-UseTLAB 参数决定)(3)虚拟机未分配的内存空间初始化为零值(默认值)(4)虚拟机对对象进行必要的设置,例如这个对象是哪个类的实例、如何才能找到对象的元数据信息、对象的 Hash 码、对象的 GC 分代年龄等信息。这些信息存放在对象的对象头中。(5) 执行<init>方法,把对象按照程序员的意愿进行初始化。2、 对象的定位访问的方式(通过引用如何去定位到堆上的具体对象的位置):(1)句柄:使用句柄的方式,Java 堆中将会划分出一块内存作为作为句柄池,引用中存储的就是对象的句柄的地址。而句柄中包含了对象实例数据和对象类型数据的地址。



(2)直接指针:使用直接指针的方式,引用中存储的就是对象的地址。Java 堆对象的布局必须必须考虑如何去访问对象类型数据。



(3)两种方式各有优点:A、使用句柄访问的好处是引用中存放的是稳定的句柄地址,当对象被移动(比如说垃圾回收时移动对象),只会改变句柄中实例数据指针,而引用本身不会被修改。B、使用直接指针,节省了一次指针定位的时间开销。3、HotSpot 的 GC 算法实现:(1)HotSpot 怎么快速找到 GC Root?HotSpot 使用一组称为 OopMap 的数据结构。在类加载完成的时候,HotSpot 就把对象内什么偏移量上是什么类型的数据计算出来,在 JIT 编译过程中,也会在栈和寄存器中哪些位置是引用。这样子,在 GC 扫描的时候,就可以直接知道哪些是可达对象了。(2)安全点:A、HotSpot 只在特定的位置生成 OopMap,这些位置称为安全点。B、程序执行过程中并非所有地方都可以停下来开始 GC,只有在到达安全点是才可以暂停。C、安全点的选定基本上以“是否具有让程序长时间执行“的特征选定的。比如说方法调用、循环跳转、异常跳转等。具有这些功能的指令才会产生 Safepoint。(3)中断方式:


A、抢占式中断:在 GC 发生时,首先把所有线程中断,如果发现有线程不在安全点上,就恢复线程,让它跑到安全点上。B、主动式中断:GC 需要中断线程时,不直接对线程操作,仅仅设置一个标志,各个线程执行时主动去轮询这个标志,当发现中断标记为真就自己中断挂起。轮询标记的地方和安全点是重合的。


(5)安全区域:一段代码片段中,对象的引用关系不会发生变化,在这个区域中任何地方开始 GC 都是安全的。在线程进入安全区域时,它首先标志自己已经进入安全区域,在这段时间里,当 JVM 发起 GC 时,就不用管进入安全区域的线程了。在线程将要离开安全区域时,它检查系统是否完成了 GC 过程,如果完成了,它就继续前行。否则,它就必须等待直到收到可以离开安全区域的信号。4、 GC 时为什么要停顿所有 Java 线程?因为 GC 先进行可达性分析。可达性分析是判断 GC Root 对象到其他对象是否可达,假如分析过程中对象的引用关系在不断变化,分析结果的准确性就无法得到保证。5、 CMS 收集器:(1)一种以获取最短回收停顿时间为目标的收集器。(2)一般用于互联网站或者 B/S 系统的服务端(3)基于标记-清除算法的实现,不过更为复杂,整个过程为 4 个步骤:


A、初始标记:标记 GC Root 能直接引用的对象 B、并发标记:利用多线程对每个 GC Root 对象进行 tracing 搜索,在堆中查找其下所有能关联到的对象。C、重新标记:为了修正并发标记期间,用户程序继续运作而导致标志产生变动的那一部分对象的标记记录。D、并发清除:利用多个线程对标记的对象进行清除


(4)由于耗时最长的并发标记和并发清除操作都是用户线程一起工作,所以总体来说,CMS 的内存回收工作是和用户线程一起并发执行的。(5)缺点:


A、对 CPU 资源占用比较多。可能因为占用一部分 CPU 资源导致应用程序响应变慢。B、CMS 无法处理浮动垃圾。在并发清除阶段,用户程序继续运行,可能产生新的内存垃圾,这一部分垃圾出现在标记过程之后,因此,CMS 无法清除。这部分垃圾称为“浮动垃圾“C、需要预留一部分内存,在垃圾回收时,给用户程序使用。D、基于标记-清除算法,容易产生大量内存碎片,导致 full GC(full GC 进行内存碎片的整理)


6、 对象头部分的内存布局:HotSpot 的对象头分为两部分,第一部分用于存储对象自身的运行时数据,比如哈希码、GC 分代年龄等。另外一部分用于指向方法区对象类型数据的指针。7、 偏向锁:偏向锁偏向于第一个获取它的线程,如果在接下来的执行过程,没有其他线程获取该锁,则持有偏向锁的线程永远不需要同步。(当一个线程获取偏向锁,它每次进入这个锁相关的同步块,虚拟机不再进行任何同步操作。当有另外一个线程尝试获取这个锁时,偏向模式宣告结束)

JVM 优化:

1、一般来说,当 s


【一线大厂Java面试题解析+核心总结学习笔记+最新架构讲解视频+实战项目源码讲义】
浏览器打开:qq.cn.hn/FTf 免费领取
复制代码


urvivor 区不够大或者占用量达到 50%,就会把一些对象放到老年区。通过设置合理的 eden 区,survivor 区及使用率,可以将年轻对象保存在年轻代,从而避免 full GC,使用-Xmn 设置年轻代的大小


2、对于占用内存比较多的大对象,一般会选择在老年代分配内存。如果在年轻代给大对象分配内存,年轻代内存不够了,就要在 eden 区移动大量对象到老年代,然后这些移动的对象可能很快消亡,因此导致 full GC。通过设置参数:-XX:PetenureSizeThreshold=1000000,单位为 B,标明对象大小超过 1M 时,在老年代(tenured)分配内存空间。


3、一般情况下,年轻对象放在 eden 区,当第一次 GC 后,如果对象还存活,放到 survivor 区,此后,每 GC 一次,年龄增加 1,当对象的年龄达到阈值,就被放到 tenured 老年区。这个阈值可以同构-XX:MaxTenuringThreshold 设置。如果想让对象留在年轻代,可以设置比较大的阈值。


4、设置最小堆和最大堆:-Xmx 和-Xms 稳定的堆大小堆垃圾回收是有利的,获得一个稳定的堆大小的方法是设置-Xms 和-Xmx 的值一样,即最大堆和最小堆一样,如果这样子设置,系统在运行时堆大小理论上是恒定的,稳定的堆空间可以减少 GC 次数,因此,很多服务端都会将这两个参数设置为一样的数值。稳定的堆大小虽然减少 GC 次数,但是增加每次 GC 的时间,因为每次 GC 要把堆的大小维持在一个区间内。


5、一个不稳定的堆并非毫无用处。在系统不需要使用大内存的时候,压缩堆空间,使得 GC 每次应对一个较小的堆空间,加快单次 GC 次数。基于这种考虑,JVM 提供两个参数,用于压缩和扩展堆空间。(1)-XX:MinHeapFreeRatio?参数用于设置堆空间的最小空闲比率。默认值是 40,当堆空间的空闲内存比率小于 40,JVM 便会扩展堆空间(2)-XX:MaxHeapFreeRatio?参数用于设置堆空间的最大空闲比率。默认值是 70, 当堆空间的空闲内存比率大于 70,JVM 便会压缩堆空间。(3)当-Xmx 和-Xmx 相等时,上面两个参数无效


6、通过增大吞吐量提高系统性能,可以通过设置并行垃圾回收收集器。(1)-XX:+UseParallelGC:年轻代使用并行垃圾回收收集器。这是一个关注吞吐量的收集器,可以尽可能地减少垃圾回收时间。(2)-XX:+UseParallelOldGC:设置老年代使用并行垃圾回收收集器。


7、尝试使用大的内存分页:使用大的内存分页增加 CPU 的内存寻址能力,从而系统的性能。-XX:+LargePageSizeInBytes?设置内存页的大小


8、使用非占用的垃圾收集器。-XX:+UseConcMarkSweepGC 老年代使用 CMS 收集器降低停顿。


9、-XXSurvivorRatio=3,表示年轻代中的分配比率:survivor:eden = 2:3


10、JVM 性能调优的工具:(1)jps(Java Process Status):输出 JVM 中运行的进程状态信息(现在一般使用 jconsole)(2)jstack:查看 java 进程内线程的堆栈信息。(3)jmap:用于生成堆转存快照(4)jhat:用于分析 jmap 生成的堆转存快照(一般不推荐使用,而是使用 Ecplise Memory Analyzer)(3)jstat 是 JVM 统计监测工具。可以用来显示垃圾回收信息、类加载信息、新生代统计信息等。(4)VisualVM:故障处理工具

类加载机制:

一、 概念:类加载器把 class 文件中的二进制数据读入到内存中,存放在方法区,然后在堆区创建一个 java.lang.Class 对象,用来封装类在方法区内的数据结构。类加载的步骤如下:1、加载:查找并加载类的二进制数据(把 class 文件里面的信息加载到内存里面)2、连接:把内存中类的二进制数据合并到虚拟机的运行时环境中(1)验证:确保被加载的类的正确性。包括:


A、类文件的结构检查:检查是否满足 Java 类文件的固定格式 B、语义检查:确保类本身符合 Java 的语法规范 C、字节码验证:确保字节码流可以被 Java 虚拟机安全的执行。字节码流是操作码组成的序列。每一个操作码后面都会跟着一个或者多个操作数。字节码检查这个步骤会检查每一个操作码是否合法。D、二进制兼容性验证:确保相互引用的类之间是协调一致的。


(2)准备:为类的静态变量分配内存,并将其初始化为默认值(3)解析:把类中的符号引用转化为直接引用(比如说方法的符号引用,是由方法名和相关描述符组成,在解析阶段,JVM 把符号引用替换成一个指针,这个指针就是直接引用,它指向该类的该方法在方法区中的内存位置)3、初始化:为类的静态变量赋予正确的初始值。当静态变量的等号右边的值是一个常量表达式时,不会调用 static 代码块进行初始化。只有等号右边的值是一个运行时运算出来的值,才会调用 static 初始化。


二、双亲委派模型:1、当一个类加载器收到类加载请求的时候,它首先不会自己去加载这个类的信息,而是把该请求转发给父类加载器,依次向上。所以所有的类加载请求都会被传递到父类加载器中,只有当父类加载器中无法加载到所需的类,子类加载器才会自己尝试去加载该类。当当前类加载器和所有父类加载器都无法加载该类时,抛出 ClassNotFindException 异常。2、意义:


提高系统的安全性。用户自定义的类加载器不可能加载应该由父加载器加载的可靠类。(比如用户定义了一个恶意代码,自定义的类加载器首先让系统加载器去加载,系统加载器检查该代码不符合规范,于是就不继续加载了)


3、定义类加载器:如果某个类加载器能够加载一个类,那么这个类加载器就叫做定义类加载器 4、初始类加载器:定义类加载器及其所有子加载器都称作初始类加载器。5、运行时包:(1)由同一个类加载器加载并且拥有相同包名的类组成运行时包(2)只有属于同一个运行时包的类,才能访问包可见(default)的类和类成员。作用是 限制用户自定义的类冒充核心类库的类去访问核心类库的包可见成员。6、加载两份相同的 class 对象的情况:A 和 B 不属于父子类加载器关系,并且各自都加载了同一个类。


三、特点:1、全盘负责:当一个类加载器加载一个类时,该类所依赖的其他类也会被这个类加载器加载到内存中。2、缓存机制:所有的 Class 对象都会被缓存,当程序需要使用某个 Class 时,类加载器先从缓存中查找,找不到,才从 class 文件中读取数据,转化成 Class 对象,存入缓存中。


三、 类加载器:两种类型的类加载器:1、 JVM 自带的类加载器(3 种):(1)根类加载器(Bootstrap):a、C++编写的,程序员无法在程序中获取该类 b、负责加载虚拟机的核心库,比如 java.lang.Objectc、没有继承 ClassLoader 类(2)扩展类加载器(Extension):a、Java 编写的,从指定目录中加载类库 b、父加载器是根类加载器 c、是 ClassLoader 的子类 d、如果用户把创建的 jar 文件放到指定目录中,也会被扩展加载器加载。(3)系统加载器(System)或者应用加载器(App):a、Java 编写的 b、父加载器是扩展类加载器 c、从环境变量或者 class.path 中加载类 d、是用户自定义类加载的默认父加载器 e、是 ClassLoader 的子类


2、用户自定义的类加载器:(1)Java.lang.ClassLoader 类的子类(2)用户可以定制类的加载方式(3)父类加载器是系统加载器(4)编写步骤:A、继承 ClassLoaderB、重写 findClass 方法。从特定位置加载 class 文件,得到字节数组,然后利用 defineClass 把字节数组转化为 Class 对象(5)为什么要自定义类加载器?A、可以从指定位置加载 class 文件,比如说从数据库、云端加载 class 文件 B、加密:Java 代码可以被轻易地反编译,因此,如果需要对代码进行加密,那么加密以后的代码,就不能使用 Java 自带的 ClassLoader 来加载这个类了,需要自定义 ClassLoader,对这个类进行解密,然后加载。


问题:Java 程序对类的执行有几种方式:1、 主动使用(6 种情况):JVM 必须在每个类“首次 主动使用”的时候,才会初始化这些类。(1) 创建类的实例(2) 读写某个类或者接口的静态变量(3) 调用类的静态方法(4) 通过反射的 API(Class.forName())获取类(5) 初始化一个类的子类(6) JVM 启动的时候,被标明启动类的类(包含 Main 方法的类)只有当程序使用的静态变量或者静态方法确实在该类中定义时,该可以认为是对该类或者接口的主动使用。2、 被动使用:除了主动使用的 6 种情况,其他情况都是被动使用,都不会导致类的初始化。

用户头像

极客good

关注

还未添加个人签名 2021.03.18 加入

还未添加个人简介

评论

发布
暂无评论
快醒醒吧!互联网大厂面试必问的JVM底层原理,你还搞不清楚