写点什么

☕【JVM 技术之旅】攻克技术盲点之“JVM 常量池们“

发布于: 2021 年 05 月 26 日
☕【JVM 技术之旅】攻克技术盲点之“JVM常量池们“

每日一句

没有失败的成功是永远不会长久,也永远不算"真正"的成功。

什么是常量

用 final 修饰的成员变量表示常量,值一旦给定就无法改变


  • final 修饰的变量有三种:静态变量、实例变量和局部变量,分别表示三种类型的常量

JVM 中的方法区

JVM 的方法区里存放着类的版本,字段,方法,接口和常量池。常量池里存储着字面量和符号引用

Java 中的常量池

实际上分为两种形态:静态常量池和运行时常量池

静态常量池

静态常量池,即 class 文件中的常量池,class 文件中的常量池不仅仅包含字符串(数字)字面量,还包含类、方法的信息,占用 class 文件绝大部分空间

class 常量池


  • 当 java 文件被编译成 class 文件之后,会在 class 文件中生成我们所说的 class 常量池。

  • class 文件中除了包含类的版本、字段、方法、接口等描述信息外,还有一项信息就是常量池(constant pool table),用于存放编译器生成的【各种字面量】(文本字符串、被声明为 final 的常量、基本数据类型的值)和【符号引用】(类和接口的全限定名、字段的名称和描述符、方法的名称和描述符),这部分内容将在类加载后进入方法区的运行时常量池中存放。



常量池中存放的符号信息,在 JVM 执行指令时需要依赖使用。常量池中的所有项都具有如下通用格式:


cp_info {    u1 tag;     //表示cp_info的单字节标记位    u1 info[];  //两个或更多的字节表示这个常量的信息,信息格式由tag的值确定}
复制代码


支持的类型信息如下:



以 CONSTANT_Class 为例,它用于表示类或者接口,格式如下:


CONSTANT_Class_info { u1 tag; u2 name_index;
复制代码


  • CONSTANT_Class_info 类型是由一个 tag 和一个 name_index 组成。

  • tag:这个值为 CONSTANT_Class (7),代表着属于一个类的引用(CONSTANT_Fieldref 代表字段引用)

  • name_index 中的 index 表示它是一个索引,引用的是 CONSTANT_UTF8_info

  • CONSTANT_Utf8_info 用于表示字符常量的值,结构如下所示:


CONSTANT_Utf8_info { u1 tag; u2 length; u1 bytes[length];}
复制代码


  • tag 表示为:CONSTANT_Utf8(1),代表着属于一个字符串值得引用

  • length:指明了 bytes[]数组的长度bytes[]数组引用了上一个 length 作为其长度字符常量采用改进过的 UTF-8 编码表示。


多余说一句:对于静态常量池我们需要知道它存在于编译器,如果说与运行时有关的话,可以说运行时中的常量是 JVM 加载 class 文件之后进行分配的



运行时常量池

运行时常量池,运行时常量池是方法区的一部分,则是 jvm 虚拟机在完成类装载操作后,将 class 文件中的常量池载入到内存中,并保存在方法区中,我们常说的常量池,就是指方法区中的运行时常量池


  • 运行时常量池相对于 Class 文件常量池的另外一个重要特征是具备动态性,Java 语言并不要求常量一定只有编译期才能产生,也就是并非预置入 Class 文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,这种特性被开发人员利用比较多的就是 String 类的 intern()方法。

  • 当类加载到内存中后,JVM 就会将 class 常量池中的内容存放到运行时常量池中,由此可知,运行时常量池也是每个类都有一个

  • 运行时常量池用来动态获取类信息,包括:class 文件元信息描述、编译后的代码数据、引用类型数据、类文件常量池的其他数据等

  • class 常量池中存的是字面量和符号引用,也就是说他们存的并不是对象的实例,而是对象的符号引用值,加载阶段:将每个 class 常量池中的符号引用值转存到运行时常量池中。

  • 之后经过解析(resolve)之后,也就是把符号引用替换为直接引用,解析的过程会去查询字符串常量池,也就是我们上面所说的 string pool,以保证运行时常量池所引用的字符串与字符串常量池中所引用的是一致的

字符串常量池(string pool)

字符串常量池里的内容是在类加载完成,经过验证,准备阶段之后在堆中生成字符串对象实例,然后将该字符串对象实例的引用值存到 string pool 中记住:在 jdk1.8 后 string pool 中存的是引用值而不是具体的实例对象,具体的实例对象是在堆中开辟的一块空间存放的)。string pool 在每个 HotSpot VM 的实例只有一份,被所有的类共享。


  • 字符串池里的内容是在类加载完成,经过验证、准备阶段之后存放在字符串常量池中。关于字符串常量池的具体实现我们这里先不展开,后面用专门的文章来进行讲解。

  • 字符串常量池的处理机制我们前面文章已经讲到,只会存储一份,被所有的类共享。基本流程是:创建字符串之前检查常量池中是否存在,如果存在则获取其引用,如果不存在则创建并存入,返回新对象引用

不同版本的字符串常量池

字符串常量池随着 JDK 版本的演化所在的位置也在不断的变化,下面我们会专门用图讲解一下。



在 JDK1.7 字符串常量池和静态变量被从方法区拿到了堆中,运行时常量池剩下的还在方法区, 也就是 hotspot 中的永久代。



在 JDK8 hotspot 移除了永久代用元空间(Metaspace)取而代之, 这时候字符串常量池还在堆,运行时常量池还在方法区,只不过方法区的实现从永久代变成了元空间(Metaspace)


常量池的好处

常量池是为了避免频繁的创建和销毁对象而影响系统性能,其实现了对象的共享。


例如字符串常量池,在编译阶段就把所有的字符串文字放到一个常量池中。


  1. 节省内存空间:常量池中所有相同的字符串常量被合并,只占用一个空间

  2. 节省运行时间:比较字符串时,==比 equals()快。对于两个引用变量,只用==判断引用是否相等,也就可以判断实际值是否相等

实际案例

String s1=new String("abc"); 
复制代码


首先你要理解常量池, 这是一个特殊的共享区域,literate(符号引用), Class 这些可以在内存中共享的不经常改变的东西,都可以放在这里。


  • 上面的代码会有两个 String 被创建,一个是你的 Class 被 ClassLoader 加载时,你的"abc"被作为常量读入,在字符串常量池里创建了一个共享的"abc"

  • 然后,当调用到 new String("abc")的时候,会在 heap 里创建这个 new String("abc");


考虑类加载阶段和实际执行时。


类加载对一个类只会进行一次。"abc"在类加载时就已经创建并驻留了(如果该类被加载之前已经有"abc"字符串被驻留过则不需要重复创建,直接使用驻留的"abc"实例)。驻留的字符串是放在全局共享的字符串常量池中的


"abc"字面量对应的 String 实例已经固定了,不会再被重复创建。所以这段代码将常量池中的对象复制一份放到 heap 中,并且把 heap 中的这个对象的引用交给 s1 持有

总结一下

  • 静态变量(静态常量池)处于编译器,存在于 class 文件内,可通过 javap verbose 命令查看字符串合并时查看的是静态常量池里面的内容;

  • 字符串常量池曾经属于运行时常量池的一部分,位于方法区,但随着 JVM 版本的演变,二者已经分开。在 JDK8 以后字符串常量池位于堆中,而运行时常量池位于方法区

发布于: 2021 年 05 月 26 日阅读数: 283
用户头像

我们始于迷惘,终于更高水平的迷惘。 2020.03.25 加入

🏆 【酷爱计算机技术、醉心开发编程、喜爱健身运动、热衷悬疑推理的”极客狂人“】 🏅 【Java技术领域,MySQL技术领域,APM全链路追踪技术及微服务、分布式方向的技术体系等】 🤝未来我们希望可以共同进步🤝

评论

发布
暂无评论
☕【JVM 技术之旅】攻克技术盲点之“JVM常量池们“