硬核万字长文,深入理解 Java 字节码指令(建议收藏)

大家好,我是二哥呀。
Java 字节码指令是 JVM 体系中非常难啃的一块硬骨头,我估计有些读者会有这样的疑惑,“Java 字节码难学吗?我能不能学会啊?”
讲良心话,不是我谦虚,一开始学 Java 字节码和 Java 虚拟机方面的知识我也感觉头大!但硬着头皮学了一阵子之后,突然就开窍了,觉得好有意思,尤其是明白了 Java 代码在底层竟然是这样执行的时候,感觉既膨胀又飘飘然,浑身上下散发着自信的光芒!
我在 infoq 共输出了 100 多篇 Java 方面的文章,总字数超过 30 万字, 内容风趣幽默、通俗易懂,收获了很多初学者的认可和支持,内容包括 Java 语法、Java 集合框架、Java 并发编程、Java 虚拟机等核心内容。

为了帮助更多的 Java 初学者,我“一怒之下”就把这些文章重新整理并开源到了 GitHub,起名《教妹学 Java》,听起来是不是就很有趣?
GitHub 开源地址(欢迎 star):https://github.com/itwanger/jmx-java
Java 官方的虚拟机 Hotspot 是基于栈的,而不是基于寄存器的。
基于栈的优点是可移植性更好、指令更短、实现起来简单,但不能随机访问栈中的元素,完成相同功能所需要的指令数也比寄存器的要多,需要频繁的入栈和出栈。
基于寄存器的优点是速度快,有利于程序运行速度的优化,但操作数需要显式指定,指令也比较长。
Java 字节码由操作码和操作数组成。
操作码(Opcode):一个字节长度(0-255,意味着指令集的操作码总数不可能超过 256 条),代表着某种特定的操作含义。
操作数(Operands):零个或者多个,紧跟在操作码之后,代表此操作需要的参数。
由于 Java 虚拟机是基于栈而不是寄存器的结构,所以大多数指令都只有一个操作码。比如 aload_0
(将局部变量表中下标为 0 的数据压入操作数栈中)就只有操作码没有操作数,而 invokespecial #1
(调用成员方法或者构造方法,并传递常量池中下标为 1 的常量)就是由操作码和操作数组成的。
01、加载与存储指令
加载(load)和存储(store)相关的指令是使用最频繁的指令,用于将数据从栈帧的局部变量表和操作数栈之间来回传递。
1)将局部变量表中的变量压入操作数栈中
xload_<n>(x 为 i、l、f、d、a,n 默认为 0 到 3),表示将第 n 个局部变量压入操作数栈中。
xload(x 为 i、l、f、d、a),通过指定参数的形式,将局部变量压入操作数栈中,当使用这个指令时,表示局部变量的数量可能超过了 4 个
解释一下。
x 为操作码助记符,表明是哪一种数据类型。见下表所示。

像 arraylength 指令,没有操作码助记符,它没有代表数据类型的特殊字符,但操作数只能是一个数组类型的对象。
大部分的指令都不支持 byte、short 和 char,甚至没有任何指令支持 boolean 类型。编译器会将 byte 和 short 类型的数据带符号扩展(Sign-Extend)为 int 类型,将 boolean 和 char 零位扩展(Zero-Extend)为 int 类型。
举例来说。
通过 jclasslib 看一下 load()
方法(4 个参数)的字节码指令。

iload_1:将局部变量表中下标为 1 的 int 变量压入操作数栈中。
aload_2:将局部变量表中下标为 2 的引用数据类型变量(此时为 String)压入操作数栈中。
lload_3:将局部变量表中下标为 3 的 long 型变量压入操作数栈中。
iload 5:将局部变量表中下标为 5 的 int 变量(实际为 boolean)压入操作数栈中。
通过查看局部变量表就能关联上了。

2)将常量池中的常量压入操作数栈中
根据数据类型和入栈内容的不同,此类又可以细分为 const 系列、push 系列和 Idc 指令。
const 系列,用于特殊的常量入栈,要入栈的常量隐含在指令本身。

push 系列,主要包括 bipush 和 sipush,前者接收 8 位整数作为参数,后者接收 16 位整数。
Idc 指令,当 const 和 push 不能满足的时候,万能的 Idc 指令就上场了,它接收一个 8 位的参数,指向常量池中的索引。
Idc_w
:接收两个 8 位数,索引范围更大。如果参数是 long 或者 double,使用
Idc2_w
指令。
举例来说。
通过 jclasslib 看一下 pushConstLdc()
方法的字节码指令。

iconst_m1:将 -1 入栈。范围 [-1,5]。
bipush 127:将 127 入栈。范围 [-128,127]。
sipush 32767:将 32767 入栈。范围 [-32768,32767]。
ldc #6 <32768>:将常量池中下标为 6 的常量 32768 入栈。
aconst_null:将 null 入栈。
ldc #7 <沉默王二>:将常量池中下标为 7 的常量“沉默王二”入栈。
3)将栈顶的数据出栈并装入局部变量表中
主要是用来给局部变量赋值,这类指令主要以 store 的形式存在。
xstore_<n>(x 为 i、l、f、d、a,n 默认为 0 到 3)
xstore(x 为 i、l、f、d、a)
明白了 xload_<n> 和 xload,再看 xstore_<n> 和 xstore 就会轻松得多,作用反了一下而已。
大家来想一个问题,为什么要有 xstore_<n> 和 xload_<n> 呢?它们的作用和 xstore n、xload n 不是一样的吗?
xstore_<n> 和 xstore n 的区别在于,前者相当于只有操作码,占用 1 个字节;后者相当于由操作码和操作数组成,操作码占 1 个字节,操作数占 2 个字节,一共占 3 个字节。
由于局部变量表中前几个位置总是非常常用,虽然 xstore_<n>
和 xload_<n>
增加了指令数量,但字节码的体积变小了!
举例来说。
通过 jclasslib 看一下 store()
方法的字节码指令。

istore_3:从操作数中弹出一个整数,并把它赋值给局部变量表中索引为 3 的变量。
astore 4:从操作数中弹出一个引用数据类型,并把它赋值给局部变量表中索引为 4 的变量。
通过查看局部变量表就能关联上了。

02、算术指令
算术指令用于对两个操作数栈上的值进行某种特定运算,并把结果重新压入操作数栈。可以分为两类:整型数据的运算指令和浮点数据的运算指令。
需要注意的是,数据运算可能会导致溢出,比如两个很大的正整数相加,很可能会得到一个负数。但 Java 虚拟机规范中并没有对这种情况给出具体结果,因此程序是不会显式报错的。所以,大家在开发过程中,如果涉及到较大的数据进行加法、乘法运算的时候,一定要注意!
当发生溢出时,将会使用有符号的无穷大 Infinity 来表示;如果某个操作结果没有明确的数学定义的话,将会使用 NaN 值来表示。而且所有使用 NaN 作为操作数的算术操作,结果都会返回 NaN。
举例来说。
任何一个非零的数除以浮点数 0(注意不是 int 类型),可以想象结果是无穷大 Infinity 的。
把这个非零的数换成 0 的时候,结果又不太好定义,就用 NaN 值来表示。
Java 虚拟机提供了两种运算模式:
向最接近数舍入:在进行浮点数运算时,所有的结果都必须舍入到一个适当的精度,不是特别精确的结果必须舍入为可被表示的最接近的精确值,如果有两种可表示的形式与该值接近,将优先选择最低有效位为零的(类似四舍五入)。
向零舍入:将浮点数转换为整数时,采用该模式,该模式将在目标数值类型中选择一个最接近但是不大于原值的数字作为最精确的舍入结果(类似取整)。
我把所有的算术指令列一下:
加法指令:iadd、ladd、fadd、dadd
减法指令:isub、lsub、fsub、dsub
乘法指令:imul、lmul、fmul、dmul
除法指令:idiv、ldiv、fdiv、ddiv
求余指令:irem、lrem、frem、drem
自增指令:iinc
举例来说。
通过 jclasslib 看一下 calculate()
方法的字节码指令。

iadd,加法
isub,减法
imul,乘法
idiv,除法
irem,取余
iinc,自增的时候 +1,自减的时候 -1
03、类型转换指令
可以分为两种:
1)宽化,小类型向大类型转换,比如 int–>long–>float–>double
,对应的指令有:i2l、i2f、i2d、l2f、l2d、f2d。
从 int 到 long,或者从 int 到 double,是不会有精度丢失的;
从 int、long 到 float,或者 long 到 double 时,可能会发生精度丢失;
从 byte、char 和 short 到 int 的宽化类型转换实际上是隐式发生的,这样可以减少字节码指令,毕竟字节码指令只有 256 个,占一个字节。
2)窄化,大类型向小类型转换,比如从 int 类型到 byte、short 或者 char,对应的指令有:i2b、i2s、i2c;从 long 到 int,对应的指令有:l2i;从 float 到 int 或者 long,对应的指令有:f2i、f2l;从 double 到 int、long 或者 float,对应的指令有:d2i、d2l、d2f。
窄化很可能会发生精度丢失,毕竟是不同的数量级;
但 Java 虚拟机并不会因此抛出运行时异常。
举例来说。
通过 jclasslib 看一下 updown()
方法的字节码指令。

i2d,int 宽化为 double
f2l, float 窄化为 long
04、对象的创建和访问指令
Java 是一门面向对象的编程语言,那么 Java 虚拟机是如何从字节码层面进行支持的呢?
1)创建指令
数组也是一种对象,但它创建的字节码指令和普通的对象不同。创建数组的指令有三种:
newarray:创建基本数据类型的数组
anewarray:创建引用类型的数组
multianewarray:创建多维数组
普通对象的创建指令只有一个,就是 new
,它会接收一个操作数,指向常量池中的一个索引,表示要创建的类型。
举例来说。
通过 jclasslib 看一下 newObject()
方法的字节码指令。

new #13 <java/lang/String>
,创建一个 String 对象。new #15 <java/io/File>
,创建一个 File 对象。newarray 10 (int)
,创建一个 int 类型的数组。
2)字段访问指令
字段可以分为两类,一类是成员变量,一类是静态变量(static 关键字修饰的),所以字段访问指令可以分为两类:
访问静态变量:getstatic、putstatic。
访问成员变量:getfield、putfield,需要创建对象后才能访问。
举例来说。
通过 jclasslib 看一下 main()
方法的字节码指令。

getstatic #2 <com/itwanger/jvm/Writer.mark>
,访问静态变量 markgetfield #6 <com/itwanger/jvm/Writer.name>
,访问成员变量 name
05、方法调用和返回指令
方法调用指令有 5 个,分别用于不同的场景:
invokevirtual:用于调用对象的成员方法,根据对象的实际类型进行分派,支持多态。
invokeinterface:用于调用接口方法,会在运行时搜索由特定对象实现的接口方法进行调用。
invokespecial:用于调用一些需要特殊处理的方法,包括构造方法、私有方法和父类方法。
invokestatic:用于调用静态方法。
invokedynamic:用于在运行时动态解析出调用点限定符所引用的方法,并执行。
举例来说。
我们用 javap -c InvokeExamples.class
来反编译一下。
InvokeExamples 类有 4 个方法,包括缺省的构造方法在内。
1)InvokeExamples()
构造方法中
缺省的构造方法内部会调用超类 Object 的初始化构造方法:
2)成员方法 run()
中
由于 ls 变量的引用类型为接口 List,所以 ls.add()
调用的是 invokeinterface
指令,等运行时再确定是不是接口 List 的实现对象 ArrayList 的 add()
方法。
由于 als 变量的引用类型已经确定为 ArrayList,所以 als.add()
方法调用的是 invokevirtual
指令。
3)main()
方法中
print()
方法是静态的,所以调用的是 invokestatic
指令。
方法返回指令根据方法的返回值类型进行区分,常见的返回指令见下图。

06、操作数栈管理指令
常见的操作数栈管理指令有 pop、dup 和 swap。
将一个或两个元素从栈顶弹出,并且直接废弃,比如 pop,pop2;
复制栈顶的一个或两个数值并将其重新压入栈顶,比如 dup,dup2,dup_×1,dup2_×1,dup_×2,dup2_×2;
将栈最顶端的两个槽中的数值交换位置,比如 swap。
这些指令不需要指明数据类型,因为是按照位置压入和弹出的。
举例来说。
通过 jclasslib 看一下 incAndGet()
方法的字节码指令。

aload_0:将 this 入栈。
dup:复制栈顶的 this。
getfield #2:将常量池中下标为 2 的常量加载到栈上,同时将一个 this 出栈。
iconst_1:将常量 1 入栈。
iadd:将栈顶的两个值相加后出栈,并将结果放回栈上。
dup_x1:复制栈顶的元素,并将其插入 this 下面。
putfield #2: 将栈顶的两个元素出栈,并将其赋值给字段 age。
ireturn:将栈顶的元素出栈返回。
07、控制转移指令
控制转移指令包括:
比较指令,比较栈顶的两个元素的大小,并将比较结果入栈。
条件跳转指令,通常和比较指令一块使用,在条件跳转指令执行前,一般先用比较指令进行栈顶元素的比较,然后进行条件跳转。
比较条件转指令,类似于比较指令和条件跳转指令的结合体,它将比较和跳转两个步骤合二为一。
多条件分支跳转指令,专为 switch-case 语句设计的。
无条件跳转指令,目前主要是 goto 指令。
1)比较指令
比较指令有:dcmpg,dcmpl、fcmpg、fcmpl、lcmp,指令的第一个字母代表的含义分别是 double、float、long。注意,没有 int 类型。
对于 double 和 float 来说,由于 NaN 的存在,有两个版本的比较指令。拿 float 来说,有 fcmpg 和 fcmpl,区别在于,如果遇到 NaN,fcmpg 会将 1 压入栈,fcmpl 会将 -1 压入栈。
举例来说。
通过 jclasslib 看一下 lcmp()
方法的字节码指令。

lcmp 用于两个 long 型的数据进行比较。
2)条件跳转指令

这些指令都会接收两个字节的操作数,它们的统一含义是,弹出栈顶元素,测试它是否满足某一条件,满足的话,跳转到对应位置。
对于 long、float 和 double 类型的条件分支比较,会先执行比较指令返回一个整形值到操作数栈中后再执行 int 类型的条件跳转指令。
对于 boolean、byte、char、short,以及 int,则直接使用条件跳转指令来完成。
举例来说。
通过 jclasslib 看一下 fi()
方法的字节码指令。

3 ifne 12 (+9)
的意思是,如果栈顶的元素不等于 0,跳转到第 12(3+9)行 12 bipush 20
。
3)比较条件转指令

前缀“if_”后,以字符“i”开头的指令针对 int 型整数进行操作,以字符“a”开头的指令表示对象的比较。
举例来说。
通过 jclasslib 看一下 compare()
方法的字节码指令。

11 if_icmple 18 (+7)
的意思是,如果栈顶的两个 int 类型的数值比较的话,如果前者小于后者时跳转到第 18 行(11+7)。
4)多条件分支跳转指令
主要有 tableswitch 和 lookupswitch,前者要求多个条件分支值是连续的,它内部只存放起始值和终止值,以及若干个跳转偏移量,通过给定的操作数 index,可以立即定位到跳转偏移量位置,因此效率比较高;后者内部存放着各个离散的 case-offset 对,每次执行都要搜索全部的 case-offset 对,找到匹配的 case 值,并根据对应的 offset 计算跳转地址,因此效率较低。
举例来说。
通过 jclasslib 看一下 switchTest()
方法的字节码指令。

case 2 的时候没有 break,所以 case 2 和 case 3 是连续的,用的是 tableswitch。如果等于 1,跳转到 28 行;如果等于 2 和 3,跳转到 34 行,如果是 default,跳转到 40 行。
5)无条件跳转指令
goto 指令接收两个字节的操作数,共同组成一个带符号的整数,用于指定指令的偏移量,指令执行的目的就是跳转到偏移量给定的位置处。
前面的例子里都出现了 goto 的身影,也很好理解。如果指令的偏移量特别大,超出了两个字节的范围,可以使用指令 goto_w,接收 4 个字节的操作数。
巨人的肩膀:
https://segmentfault.com/a/1190000037628881
除了以上这些指令,还有异常处理指令和同步控制指令,我打算吊一吊大家的胃口,大家可以期待一波~~
(骚操作)
路漫漫其修远兮,吾将上下而求索
想要走得更远,Java 字节码这块就必须得硬碰硬地吃透,希望二哥的这些分享可以帮助到大家~
叨逼叨
二哥在 infoq 上写了很多 Java 方面的系列文章,有 Java 核心语法、Java 集合框架、Java IO、Java 并发编程、Java 虚拟机等,也算是体系完整了。

为了能帮助到更多的 Java 初学者,二哥把自己连载的《教妹学Java》开源到了 GitHub,尽管只整理了 50 篇,发现字数已经来到了 10 万+,内容更是没得说,通俗易懂、风趣幽默、图文并茂。
GitHub 开源地址(欢迎 star):https://github.com/itwanger/jmx-java
如果有帮助的话,还请给二哥点个赞,这将是我继续分享下去的最强动力!
版权声明: 本文为 InfoQ 作者【沉默王二】的原创文章。
原文链接:【http://xie.infoq.cn/article/5506fc4a46a34bbec4d96b6f0】。文章转载请联系作者。
评论