JVM 探究:全面解析 OOM 异常,都在这了,mysql 数据库基础与实例教程孔祥盛
要解决这个区域的异常,一般的手段是先通过内存映像分析工具(如 Eclipse Memory Analyzer)对 Dump 出来的堆转储快照(在项目目录下)进行分析,重点是确认内存中的对象是否是必要的,也就是要先分清楚到底是出现了内存泄漏(Memory Leak)还是内存溢出(Memory Overflow)。
分析过程如下:
1. 通过 mat 打开快照文件,选择运行内存泄漏嫌疑报告
通过报告上面的饼图,可以清晰地看到一个可疑对象消耗了系统 96% 的内存。
在饼图的下方有对这个可疑对象的进一步描述。可以看到内存是由 java.lang.Object[]的数组实例消耗的,system class loader 负责这个对象的加载。通过描述可以了解到一些线索,比如是哪个类占用了绝大多数的内存,它属于哪个组件等等。
因此需要分析问题的原因,为什么一个 Object[]会占据了系统 99% 的内存?谁阻止了垃圾回收机制对它的回收?
回顾下 JAVA 的内存回收机制,内存空间中垃圾回收的工作由垃圾回收器 (Garbage Collector,GC) 完成的,它的核心思想是:对虚拟机可用内存空间,即堆空间中的对象进行识别,如果对象正在被引用,那么称其为存活对象,反之,如果对象不再被引用,则为垃圾对象,可以回收其占据的空间,用于再分配。
在垃圾回收机制中有一组元素被称为根元素集合,它们是一组被虚拟机直接引用的对象,比如,正在运行的线程对象,系统调用栈里面的对象以及被 system class loader 所加载的那些对象。堆空间中的每个对象都是由一个根元素为起点被层层调用的。因此,一个对象还被某一个存活的根元素所引用,就会被认为是存活对象,不能被回收,进行内存释放。因此,可以通过分析一个对象到根元素的引用路径来分析为什么该对象不能被顺利回收。如果说一个对象已经不被任何程序逻辑所需要但是还存在被根元素引用的情况,可以说这里存在内存泄露。2. 具体分析
点击“Details ”链接,查看对可疑对象 的详细分析报告。
![image.png](https://upload-images.jianshu.io/upload_images/24195226-2
075c64f4ae53588.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
查看下从 GC 根元素到内存消耗聚集点的最短路径,在 Shortest Paths To the Accumulation Point(GC root 到聚集点的最短路径,就是持有可能泄漏内存对象的最近一层)的列表中,可以追溯到问题代码的类树的结构,并找到自己代码中的类。 在列表中,有两列 Shallow Heap 和 Retained Heap。Shallow Heap 指的是就是对象本身占用内存的大小,不包含对其他对象的引用,也就是对象头加成员变量(不是成员变量的值)的总和。Retained Heap 指的是该对象自己的 Shallow Heap,加上从该对象能直接或间接访问到对象的 Shallow Heap 之和。换句话说,Retained Heap 是该对象被 GC 之后所能回收到内存的总和。
可以很清楚的看到整个引用链,内存聚集点是一个拥有大量对象的集合。
接下来,再继续看看,这个对象集合里到底存放了什么,为什么会消耗掉如此多的内存。在 Accumulated Objects in Dominator Tree 列表中,可以查看创建的大量的对象的聚集详情,即完整的 reference chain 。
在这张图上,我们可以清楚的看到,这个对象集合中保存了大量 OOMObject 对象的引用,就是它导致的泄露。
如果确定为内存泄露,可进一步通过工具查看泄露对象到 GC Roots 的引用链。于是就能找到泄露对象是通过怎样的路径与 GC Roots 相关联并导致垃圾收集器无法自动回收它们的。掌握了泄露对象的类型信息及 GC Roots 引用链的信息,就可以比较准确地定位出泄露代码的位置。
如果不存在泄露,换句话说,就是内存中的对象确实都还必须存活着,那就应当检查虚拟机的堆参数(-Xmx 与-Xms),与机器物理内存对比看是否还可以调大,从代码上检查是否存在某些对象生命周期过长、持有状态时间过长的情况,尝试减少程序运行期的内存消耗。
2. 虚拟机栈和本地方法栈溢出
由于在 HotSpot 虚拟机中并不区分虚拟机栈和本地方法栈,因此,对于 HotSpot 来说,虽然-Xoss 参数(设置本地方法栈大小)存在,但实际上是无效的,栈容量只由-Xss 参数设定。关于虚拟机栈和本地方法栈,在 Java 虚拟机规范中描述了两种异常:
如果线程请求的栈深度大于虚拟机所允许的最大深度,将抛出 StackOverflowError 异常。
如果虚拟机在扩展栈时无法申请到足够的内存空间,则抛出 OutOfMemoryError 异常。
这里把异常分成两种情况,看似更加严谨,但却存在着一些互相重叠的地方:当栈空间无法继续分配时,到底是内存太小,还是已使用的栈空间太大,其本质上只是对同一件事情的两种描述而已。
定义大量的本地变量,增大此方法帧中本地变量表的长度或者设置-Xss 参数减少栈内存容量,这两种操作都会抛出 StackOverflowError 异常。
/**
虚拟机栈 SOF 测试
<p>
-Xss128k */public class JavaVMStackSOF {private int stackLength = 1;
public void stackLeak(){stackLength++;stackLeak();}
public static void main(String[] args) throws Throwable{JavaVMStackSOF oom = new JavaVMStackSOF();try {oom.stackLeak();}catch (Throwable e){System.out.println("stack length :"+oom.stackLength);throw e;}}
}
运行结果如下,抛出 StackOverflowError 异常时输出的堆栈深度相应缩小。
所以,如果在单线程的情况下,无论是栈帧太大还是虚拟机栈容量太小,当内存无法再分配的时候,虚拟机抛出的是 StackOverflowError 异常。
如果在多线程下,不断地建立线程可能会产生 OutOfMemoryError 异常。
/**
创建线程导致内存溢出异常 注意:windows 平台下执行可能会导致系统卡死
-Xss2M*/public class JavaVMStackOOM {private void dontStop(){while(true){}}public void stackLeakByThread(){while(true){Thread thread = new Thread(new Runnable() {@Overridepublic void run() {dontStop();}});thread.start();}}
public static void main(String[] args) {JavaVMStackOOM oom = new JavaVMStackOOM();oom.stackLeakByThread();}}
运行结果如下:
上面代码导致 OOM 的原因不难理解,操作系统分配给每个进程的内存是有限制的,譬如 32 位的 Windows 限制为 2GB。虚拟机提供了参数来控制 Java 堆和方法区的这两部分内存的最大值。剩余的内存为 2GB(操作系统限制)减去 Xmx(最大堆容量),再减去 MaxPermSize(最大方法区容量),程序计数器消耗内存很小,可以忽略掉。如果虚拟机进程本身耗费的内存不计算在内,剩下的内存就由虚拟机栈和本地方法栈“瓜分”了。每个线程分配到的栈容量越大,可以建立的线程数量自然就越少,建立线程时就越容易把剩下的内存耗尽;64 位的 Windows 限制为 8TB,理论上是可以创建很多线程的,但是,谁的机器内存有 8TB??所以,在其他系统如 Linux,创建多线程时,尽管未达到进程的内存限制,往往也会达到机器的最大内存,导致 OOM。
在开发多线程的应用时特别注意,出现 StackOverflowError 异常时有错误堆栈可以阅读,相对来说,比较容易找到问题的所在。而且,如果使用虚拟机默认参数,栈深度在大多数情况下(因为每个方法压入栈的帧大小并不是一样的,所以只能说在大多数情况下)达到 1000~2000 完全没有问题,对于正常的方法调用(包括递归),这个深度应该完全够用了。但是,如果是建立过多线程导致的内存溢出,在不能减少线程数或者更换 64 位虚拟机的情况下,就只能通过减少最大堆和减少栈容量来换取更多的线程。
3. 方法区和运行时常量池溢出
String.intern()是一个 Native 方法,它的作用是:如果字符串常量池中已经包含一个等于此 String 对象的字符串,则返回代表池中这个字符串的 String 对象;否则,将此 String 对象包含的字符串添加到常量池中,并且返回此 String 对象的引用。
import java.util.ArrayList;import java.util.List;
/**
运行时常量池导致的内存溢出异常*/public class RuntimeConstantPoolOOM {public static void main(String[] args) {//使用 List 保持常量池引用,避免 Full GC 回收常量池行为 List<String> list = new ArrayList<String>();//10M 的 PermSize 在 integer 范围内足够产生 OOMint i = 0;while (true){list.add(String.valueOf(i++).intern());}}}
在 JDK 1.6 及之前的版本中,由于常量池分配在永久代内,我们可以通过-XX:PermSize 和-XX:MaxPermSize 限制方法区(HotSpot 虚拟机中的永久代)大小,从而间接限制其中常量池的容量。
JDK 1.6 通过设置 VM 参数设置永久代大小 -XX:PermSize=10M -XX:MaxPermSize=10M,运行结果如下:
报错信息为永久代溢出,说明 JDK1.6 时运行时常量池在永久代。
JDK 1.7 设置 VM 参数 -Xmx20m -Xms20m -XX:-UseGCOverheadLimit,这里的-XX:-UseGCOverheadLimit 是关闭 GC 占用时间过长时会报的异常,然后限制堆的大小 -Xmx20m -Xms20m 。
报错信息为堆内存溢出,原因是增加的常量都放到了堆中,所以限制堆内存以后,不断增加常量,导致堆内存溢出。说明 JDK1.7 时运行时常量池在堆中。
在 JDK1.8 中测试,设置 VM 参数 -Xmx20m -Xms20m -XX:-UseGCOverheadLimit,结果和 JDK1.7 相同。
补充一点:如果在上面的 JDK 1.7 或者 JDK1.8 中不通过 VM 参数 -XX:-UseGCOverheadLimit 关闭 GC 占用时间过长时报的异常,即只设置 VM 参数 -Xmx20m -Xms20m ,执行结果如下:
并行/并发回收器在 GC 回收时间过长时会抛出 OutOfMemroyError。过长的定义是,超过 98%的时间用来做 GC 并且回收了不到 2%的堆内存。用来避免内存过小造成应用不能正常工作。
由此可证明,在 JDK1.2 ~ JDK6 的实现中,HotSpot 使用永久代实现方法区,从 JDK7 开始 Oracle HotSpot 开始移除永久代,JDK7 中符号表被移动到 Native Heap 中,字符串常量和类引用被移动到 Java Heap 中。在 JDK8 中,字符串常量依然在堆中,“永久代”完全被元空间(Meatspace)所取代。
运行如下一段代码测试 String.intern()的返回引用
public class InternMethodTest {public static void main(String[] args) {String str1=new StringBuilder("引用").append("测试").toString();System.out.println(str1.intern()==str1);
String str2=new StringBuilder("ja").append("va").toString();System.out.println(str2.intern()==str2);}}
评论