代码编译的结果从本地机器码转变为字节码,是存储格式发展的一小步,却是编程语言发展的一大步。
一、Class类文件的结构
Class文件是一组以8位字节为基础单位的二进制流,各个数据项目严格按照顺序紧凑地排列在Class文件之中,中间没有添加任何分隔符,这使得整个Class文件中存储的内容几乎全部是程序运行的必要数据,当遇到需要占用8位字节以上空间的数据项时,则会按照高位在前的方式分割成若干个8位字节进行存储。
Class文件格式只有两种数据类型:无符号数和表。 无符号数属于基本的数据类型,以u1、u2、u4、u8来分别代表1个字节、2个字节、4个字节和8个字节的无符号数。表是由多个无符号数或者其他表作为数据项构成的复合数据类型,所有表都习惯性的以“_info”结尾。
Class文件格式:
a)magic
类型:u4,数量1
简介:每个Class文件的头4个字节称为魔数,它的唯一作用是确定这个文件是否为一个能被虚拟机接受的Class文件。
b)minor_version
类型:u2,数量1
c)major_version
类型:u2,数量1
简介:紧接着魔数的4个字节存储的是Class文件的版本号
d)constant_pool_count
类型:u2,数量1
简介:紧接着版本号的是常量池入口,这个字段是常量池容量计数值。
e)constant_pool
类型:cp_info,数量constant_pool_count-1
简介:常量池中主要存放两大类常量:字面量和符号引用。
字面量比较接近Java语言层面的常量概念,如温恩字符串、声明为final的常量值等;而符号引用则属于编译原理方面的概念,包括下面三类常量:
类和接口的全限定名、字段的名称和描述符、方法的名称和描述符。
关于编译
Java编译时并不像C和C++那样有“连接”步骤,而是在虚拟机加载Class文件的时候才进行动态连接。就是说,在Class文件中不会保存各个方法、字段的最终内存布局信息。
f)access_flag
类型:u2,数量1
简介:这个访问标志用于识别一些类或者接口层次的访问信息,比如是类还是接口,是否为public类型。
g)类索引、父类索引与接口索引集合
类型:this_class u2 数量1,super_class u2 数量1, interfaces_count u2 数量1,interfaces u2 数量interface_count。
简介:Class文件中由这三项数据来确定这个类的继承关系。
h)字段表集合
类型:fields_count u2 数量1,fields field_info 数量fields_count
简介:字段表(field_info)用于描述接口或者类中声明的变量。字段(field)包括类级变量以及实例级变量,但不包括在方法内部声明的局部变量。
i)方法表集合
类型:methods_count u2 数量1,methods method_info 数量methods_count
简介:方法表结构包括范文标志、名称索引、描述符索引、属性表集合。
j)属性表集合
类型:attributes_count u2 数量1,attributes attribute_count 数量attributes_count
简介:在Class文件、字段表、方法表都可以携带自己的属性表集合,以描述某些场景专有的信息。
二、字节码指令简介
1.字节码与数据类型
在Java虚拟机的指令集中,大多数的指令都包含了其操作所对应的数据类型信息。如iload指令用于从局部变量表中加载int型的数据到操作数栈中,d代表double,s代表short、a代表reference。也有一些指令的助记符中没有明确知名操作类型的字母,如arraylength指令,它没有代表数据类型的特殊字符,但操作数永远只能是一个数组类型的对象。
2.加载与存储指令
用于将数据在栈帧中的局部变量表和操作数栈之间来回传输。
a)将一个局部变量加载到操作数栈:iload、lload、fload、dload、aload
b)将一个数值从操作数栈存储到局部变量表:istore、lstore、fstore、dstore、astore
c)将一个常量加载到操作数栈:bipush、sipush、ldc、aconst、iconst、fconst
d)扩充局部变量表的访问索引的指令:wide
3.运算指令
用于对两个操作数栈上的值进行某种特定运算,并把结果存入到栈顶。
加法指令:iadd、ladd、fadd、dadd
减法指令:isub、lsub、fsub、dsub
乘法指令:imul、lmul、fmul、dmul
除法指令:idiv、ldiv、fdiv、ddiv
求余指令:irem、lrem、frem、drem
省略写法:取反:neg;位移:shr;位或:or;位与:and;位异或:xor;局部变量自增:inc
4.类型转换指令
宽化类型转换:即小范围类型向大范围类型的安全转换,如int转float、long等,直接支持不需指令。
窄化类型转换:必须显示指定转换指令,如i2b,i2s,f2i,d2f等。
5.对象创建与访问指令
创建类实例的指令:new
创建数组的指令:newarray、anewearray、multianewarray
访问类字段和实例字段的指令:getfield、putfield、getstatic、putstatic
把一个数组元素加载到操作数栈的指令:baload、caload、saload、iaload、faload、daload、aaload
将一个操作数栈的值存储到数组元素中的指令:bastore、castore、sastore、iastore、fastore、dastore、aastore
取数组长度的指令:arraylength
检查类实例类型的指令:instantceof、checkcast
6.操作数栈管理指令
将操作数栈的栈顶一个或两个元素出栈:pop、pop2
复制栈顶一个或两个数值并将复制值或双份的复制值重新压入栈顶:dup、dup2、dup_x1、dup2_x1、dup_x2、dup2_x2
将栈最顶端的两个数值互换:swap
7.控制转移指令
条件分支(如ifeq、ifle)、符合条件分支、无条件分支(如goto、ret)
8.方法调用和返回指令
invokevirtual:调用对象的实例方法
invokeinterface:调用接口方法,它会在运行时搜索一个实现了这个接口方法的对象,找出合适的方法进行调用
invokespecial:调用一些需要特殊处理的实例方法,如实例初始化方法、私有方法和父类方法
invokestatic:调用类方法
invokedynamic:用于在运行时动态解析出调用点限定符所引用的方法,并执行该方法
8.异常处理指令
Java中显式抛出异常的操作都由athrow指令来完成
9.同步指令
Java虚拟机可支持方法级的同步和方法内部一段指令序列的同步,这两种同步结构都是使用管程(Monitor)来支持的。方法级的同步是隐式的。同步一段指令集序列通常由Java语言中的synchronized语句块来表示。
网友评论