美文网首页
字节码层面分析class类文件结构

字节码层面分析class类文件结构

作者: 旺仔_100 | 来源:发表于2021-08-29 15:06 被阅读0次

首先我们从一道面试题开始:

java中string字符串长度有限制吗?

平时项目中,我们经常会用到String来声明字符串,比如String str = "bac",但是你从来没有想过字符串常量到底有米有长度限制。要彻底答对这道题,就需要先学习今天所讲的内容-------class文件。

class的来龙去脉

java能够实现"一次编译,到处运行",这其中class占了很大的功劳。为了让java具有良好的跨平台能力,java独具匠心的提供了一种中间代码----字节码类文件(.class文件)。有了字节码,无论哪种平台(如:mac、window、linux等),只要安装了虚拟机都可以直接运行字节码。

并且有了虚拟机,java虚拟机会java语言也就没有了耦合性。java虚拟机设计出来并不是为了单单运行java文件,如今可以支持groovy、JRuby、Jython、Scala等。之所以可以执行这些语言,是因为他们编译之后都可以生成字节码,能被java解释并执行。

image.png
上帝视角查看class文件

如果从上帝视角看class文件,class文件里面只有两种数据机构:无符号数

  • 无符号数:属于基本数据类型,以u1、u2、u4、u8分别表示一个字节、两个字节、四个字节、八个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或者字符串(UTF-8编码)。
  • :表是由多个无符号数或者其他表作为数据项构成的复合数据类型,class中所有的表都是_info结尾,整个class文件就是一张表。
    这两者的关系可以用图表示:
    表和无符号之间的关系.png
    可以看出一张表中可以包含其他无符号数和其他表格。伪代码可以如下所示:
//无符号
u1 = byte[1];
u2 = byte[2];
u4 = byte[4];
u8 = byte[8];
//表
class_table{
      u1 tag;
      u2 index2;
      ...
     //表中也可以引用其他表
      method_table mt;
      ...

}

class文件结构

刚才我们说在class文件中指存在无符号数和表这两种结构。而这些无符号数和表就构成了class中的各个结构。这些结构按照预先规定排好的顺序紧密的从前往后排列,相邻项之间米有任何间隙。如下图所示:


image.png

当jVM加载某个class文件时,JVM就是根据上图中的结构去解析class文件,加载class文件到内存中,并在内存中分配相应的空间。具体某一结构需要占用多大空间,可以参考下图:


image.png

看到这里你可能会有点概念混淆,分不清无符号数、表格以及上面的机构是什么关系。其实可以举一个简单的例子:人类的身体是由H、O、C、N等元素组成的。但是这些元素又是按照一定的规律组成了人类身体的各个器官。class中的无符号和表格就相当于人类身体中的H、O、C、N等元素,而class结构图中的各个结构相当于人类的各个器官。并且这些器官组织是有严格顺序的,毕竟眼睛不能长到屁股上。

实例分析
理清这些概念之后,通过一个简单的Java代码实例,来看一下上面这几个机构的详情。首先编写一个简单的Java源代码Test.java,如下所示:

package com.example.asmtest;


import java.io.Serializable;

/**
 *  create by  zhaoyang ao  2021/8/29
 */
public class Test implements Serializable,Cloneable {
    private int num = 1;

    public int add(int i){
        int j = 10;
        num = num + i;
        return num;
    }
}

我们执行javac命令,可以生成对应的字节码,使用十六进制编辑器打开(mac可以使用ultraEdit)


16进制字节码.png

前四个字节Ca fe ba be 是魔数,代码是一个可以解析的字节码文件。
接着的00 00 00 34是class文件的版本号,0000代码次版本号,0034代表主版本号 ,52就是jdk1.8.0。
在后面的就是常量池,常量池中保存了各种相关信息,比如类的名称、父类的名称、类中的方法名、参数名、参数类型等,都保存在常量池中。

常量池中的每一项都是一个表,其中项目类型共有14种,如下:
常量池中的表.png

最前面两个字节是常量池的长度,接着常量池中的每一项都会有一个u1大小的tag。tag的值是表的标识。根据标识,JVM判断当前是那个表结构。

我们还可以通过javap -v Test.class来直接查看常量池
常量池.png
访问标识

紧紧跟在常量池后面的是访问标识,占两个字节。


访问标识.png
类索引、父类索引与接口索引计数器

在访问标识后的两个字节就是类索引,类索引后的两个字节就是父类索引,父类索引后的两个字节就是接口索引计数器。


image.png
字段访问标志

对于java类中的变量,也可以使用public、private、final、static等标志。因此解析的时候先判断他的访问标志,如下:


image.png
方法表

字段表后面跟着的就是方法表的常量。方法表常量是一个计数器开始的,因为一个类中的方法数量不固定。
方法也有自己的访问标志


image.png
属性表

在解析字段和方法的时候,在他们的具体机构中我们能够看到一个attribute_info的表,这就是属性表。
属性表并没有一个固定的结构,各种不同的属性只要满足以下结构即可:

CONSTANT_Attribute_info{
    u2 name_index;
    u2 attribute_length length;
    u1[] info;
}

到这里就完了,主要参考了姜新星的Android工程进阶34讲的第三讲。

相关文章

  • 字节码层面分析class类文件结构

    首先我们从一道面试题开始: java中string字符串长度有限制吗? 平时项目中,我们经常会用到String来声...

  • 字节码层面分析class类文件结构

    一个面试题:Java 中 String 字符串的长度有限制么? 【答案】String 的长度是有限制的。 编译器的...

  • 字节码层面分析class类文件结构课程

    Java中String字符的长度有限制吗? 这是面试中有可能会被问到的问题,对于这个问题答案,和class文件有关...

  • JVM与DVM ——(3)字节码层面分析 class 类文件结构

    本文将从字节码层面分析 class 类文件结构。首先来看一道面试题: java中 String 字符串的长度有限制...

  • JVM

    JVM 基础-类字节码详解 多语言编译为字节码在 JVM 运行 Java 字节码文件-- Class文件的结构属性...

  • 字节码层面分析class文件

    class的来龙去脉 Java提供了一种可以在所有平台上都能使用的一种中间代码--字节码类文件(class文件) ...

  • 类文件结构及字节码指令

    类文件结构及字节码指令 1. Class类文件的结构 Class文件格式采用一种类似于C语言结构体的伪结构来存储数...

  • Java字节码结构解析

    本文通过解析Class文件中字节码的结构,来加深对Java类文件结构的理解。建议先阅读Java类文件结构解析这篇文...

  • 虚拟机类文件结构和加载机制

    类文件结构 虚拟机在对编译代码的时候会产生字节码的文件,也就是class文件,这个字节码文件的产生是java虚拟机...

  • java 字节码

    字节码: 1: 字节码结构,class文件的二进制文件意义2: 现有的字节码技术,asm与javasist3: d...

网友评论

      本文标题:字节码层面分析class类文件结构

      本文链接:https://www.haomeiwen.com/subject/ikmwiltx.html