一个 java 文件的 JVM 之旅 | 京东物流技术团队
准备
我是小 C 同学编写得一个 java 文件,如何实现我的功能呢?需要去 JVM(Java Virtual Machine)这个地方旅行。
变身
我高高兴兴的来到 JVM,想要开始 JVM 之旅,它确说:“现在的我还不能进去,需要做一次转换,生成 class 文件才行”。为什么这样呢?
JVM 不能直接加载 java 文件的原因:
Java 源代码中包含了许多高级语言特性和语法,比如类、继承、多态、异常处理等等。这些高级特性在 JVM 中没有直接对应的形式,只有通过编译器的处理才能转化为 JVM 可以理解的字节码指令。
Java 源代码需要经过编译器的编译过程,才能生成相应的字节码文件,然后再由 JVM 加载、解释执行。在编译过程中,编译器对源代码进行语法分析、类型检查、优化等操作,最终生成与目标平台兼容的 Java 字节码文件。
JVM 只能够加载和运行符合 Java 虚拟机规范的.class 字节码文件,而不能够直接加载和运行 Java 源代码文件。
编译
知道原因后,我又问 JVM,我怎么才能变成 class 文件呢,JVM 告诉我可以通过 javac 命令。
javac
javac 是 Java 编译器命令,用于将 Java 源代码文件编译成字节码文件(.class 文件)。
命令格式
javac [options] [source files]
options:为编译选项,可以控制编译器的行为,例如指定类路径、生成调试信息、压缩文件等。
source files:为需要编译的 Java 源代码文件,可以指定多个文件,用空格隔开。如果不指定源代码文件,则 `javac` 命令会在当前目录查找所有扩展名为
.java
的文件进行编译。
需要注意的是,`javac` 命令需要在正确配置 JDK 环境后才能使用。JDK(Java Development Kit)是 Java 开发工具包的缩写,是 Java 应用程序开发的核心组件之一。
具体实现
编译器在编译源文件时,需要对源文件进行语法分析、语义分析和类型检查等操作。
语法分析:
javac
命令首先将源文件读入内存,然后进行词法分析和语法分析。词法分析器负责将源文件中的字符序列转换成一个个单词(Token),然后语法分析器将单词组合成可以被解释执行的语法结构,形成抽象语法树(AST)。语义分析:
javac
命令在生成 AST 之后,进行语义分析。语义分析器主要是为了检查程序中是否存在语义错误,例如变量未定义、类型不匹配等,如果发现语义错误,编译器会输出错误信息,并中止编译过程,不会生成字节码文件。类型检查:
javac
命令在语义分析的基础上,进行类型检查。类型检查器主要是检查程序的类型是否匹配和兼容,如果类型不匹配或不兼容,编译器会在编译期间报告错误。代码生成:
javac
命令在生成抽象语法树后,对其进行优化和转化,最终生成字节码文件。编译器会根据目标代码的平台和版本,生成适当的字节码文件。
执行
知道怎么变身后,我立即通过 javac 命令,让自己变成可以被 JVM 执行的 class 文件。
加载
变成 class 文件后,我怎么能进入 JVM 内部呢,是走着去还是坐车去呢?JVM 告诉我要通过类加载器进入。
类加载器
Java 类加载器是 Java 虚拟机(JVM)中的一个重要组件,它负责将类文件(.class 文件)加载到 JVM 中。
分类
Java 中的类加载器是按照其加载类的特点进行分类的,主要有以下几种类型:
启动类加载器(Bootstrap ClassLoader):负责加载 JRE/lib/rt.jar 中的核心 Java 类库,是最顶层的类加载器,不是 Java 类(因为在 JVM 实现时就已经存在)。
扩展类加载器(Extension ClassLoader):负责加载 JRE/lib/ext 目录下的扩展类库,也是由 C++ 实现的类加载器。
应用程序类加载器(APP ClassLoader):负责加载应用程序的类,包括在 CLASSPATH 中指定的类库或者目录中的 Java 类。
自定义类加载器(Custom ClassLoader):继承自 ClassLoader 类,实现自己的类加载器,主要用于加载一些自定义的类或者修改某些类的字节码。
查看使用的类加载器
代码:
执行结果:
自定义类加载器
自定义类加载器主要包括两种类型:
独立的自定义类加载器,通过重载 ClassLoader 类中的 findClass 方法来实现加载类文件的功能;
基于 URLClassLoader 类实现的自定义类加载器,使用 URL 的形式来指定类文件的位置。
重载 ClassLoader
代码:
说明:
上述代码继承了ClassLoader
类,并重写了其中的findClass()
方法,实现从指定目录中加载类文件的功能。
在findClass()
方法中,首先通过getClassData()
方法读取并返回类文件的字节数组,如果获取的字节数组为空,则抛出ClassNotFoundException
异常;否则,使用defineClass()
方法将字节数组转换为 Class 对象,并返回该对象。
在getClassData()
方法中,根据传入的类名生成类文件路径,并使用FileInputStream
将类文件读入字节数组中。
使用:
基于 URLClassLoader
代码:
说明:
上述代码继承了 `URLClassLoader` 类,并重写了其中的 `findClass()` 方法,实现先尝试使用父类加载器进行加载,如果无法加载,则尝试使用 URL 加载类文件的功能。在 `getClassData()` 方法中,会遍历 `URLClassLoader` 中定义的 URL,检查类文件是否存在,并返回类文件的字节数组,如果无法找到类文件,则返回 `null`。
使用:
双亲委派
加载器那么多,我具体是哪个类进行加载得呢?双亲委派机制告诉我答案.
定义
双亲委派是一种 Java 类加载器的工作机制,它将类加载请求委派给父类加载器,直到顶级系统类加载器。基本思想是,除非有特殊需求,否则所有类的加载任务都应该由父类加载器完成,从而保证 Java 核心库的类型安全和稳定性,并防止恶意代码的自行布置。如果一个类没有在父类加载器中被发现,子类加载器才会尝试加载该类。这种类加载器之间的父子关系被称为“双亲委派模型”.
如图:
意义
为什么通过双亲委派进行加载呢?
避免重复加载
提高安全性
维护 Java 平台的一致性
代码优化
Linking
加载过后,我是否就可以被使用了呢?答案是否定的,我还要经历 Lingking 阶段,包括 Verification、Preparation 和 Resolution。
Verification(验证)
在验证阶段,Java 虚拟机会进行语法与语义的检查,以保证 class 文件的完整性和正确性,同时保证被加载的 class 与虚拟机的版本兼容。主要的检查内容包括文件格式、字节码语义、符号引用等。
Preparation(准备)
在准备阶段,Java 虚拟机会为类变量分配内存,并且赋予初始值。如果类变量包含有静态变量,那么这时也会初始化静态变量。因此,在这个阶段,类变量所使用的空间已经被分配,将其设置为默认初始值即可。
Resolution(解析)
在解析阶段,将类或接口中的符号引用转化为直接引用的过程。在 Java 虚拟机加载类时,符号引用是一种指向常量池中某个符号的引用,而直接引用则是指向内存中某个位置的直接指针。解析阶段可以理解为是在解决类之间的依赖关系,使各个类之间可以像使用自身成员一样使用别的类中的成员。
初始化
在验证、准备和解析后,我还要经过初始化,才能被使用。
定义
初始化是指在类加载过程的最后一步,JVM 要对类进行一些初始化的操作,确保类可以安全地使用。在这个阶段,往往包括静态变量显式赋值和静态代码块执行。
内容
静态变量显式赋值
当类加载器完成类的加载、验证、准备后,在初始化阶段,JVM 对类的静态变量进行显式赋值。如果类定义了多个静态变量,JVM 会按照代码中声明的顺序进行初始化,并且若发现此过程需要访问到其他未初始化的类,JVM 会先完成这些类的初始化。
静态代码块的执行
除了静态变量的显式赋值,类的静态代码块也会在初始化阶段执行。当 JVM 执行类加载的 Initializing 阶段时,会执行类中所有静态代码块的内容,如果类中没有定义静态代码块,则不执行。这个过程一般用于在使用之前对类进行初始化。
接口初始化
当一个类在初始化时,如果发现其父类还未进行初始化,JVM 会先对其父类进行初始化。如果该类实现了接口,也会对这个接口进行初始化操作,接口的初始化过程和类一样,都会进行静态变量显式赋值及静态代码块执行,同时还会检查接口中的所有静态方法。
功能实现
初始化之后,我才真正的进入 JVM 中,其它小伙伴需要我的时候,只需要创建我的实例,就可以使用我的功能了,得到我帮助得小伙伴都很感谢我。
GC
在 JVM 中我过得很开心,也留下了很多足迹。在我走后,如何让我得足迹不对其他小伙伴有影响呢?GC 可以帮我解决这个问题。
定义
GC(Garbage Collection)是 JVM 提供的垃圾回收机制。在 Java 中,对象是动态分配的,内存是由 JVM 自动管理,而不是由程序员手动分配和释放。当一个对象不再被程序引用时,就应该由垃圾回收器回收其占用的内存,这样可以防止内存泄漏和提高内存的。
小结
通过我的旅行,你知道 JVM 是怎么加载一个类的了么?我们通过加载、Linking、初始化和使用等各个阶段,将 Java 类完整地载入内存并执行其中定义的方法和变量。这个过程中,每个阶段都扮演着不同的角色,并为类的正常运行提供了必要的支持。
作者:京东物流 陈昌浩
来源:京东云开发者社区 自猿其说 Tech 转载请注明来源
版权声明: 本文为 InfoQ 作者【京东科技开发者】的原创文章。
原文链接:【http://xie.infoq.cn/article/b47130bface5cb2d12dba693b】。文章转载请联系作者。
评论