美文网首页
ASM框架学习(一)-基本概念

ASM框架学习(一)-基本概念

作者: 奔跑地蜗牛 | 来源:发表于2019-05-16 15:06 被阅读0次

    简介

    ASM是java字节码操作框架,利用该框架可以达到动态修改java运行对象代码的目的,也可以实现动态代理等功能;

    线程和栈帧

    要了解ASM字节码操作,先要熟悉jvm线程与栈帧结构,jvm开辟一个线程,便会开辟属于这个线程虚拟机栈,本地方法栈,程序计数器,其主要作用如下:

    • 虚拟机栈:以栈帧为基本单位,一个栈帧的开始地址代表一个方法的入口,栈帧里面有操作数栈,局部变量表,动态链接,方法出口,其他信息;其说明如下:
      • 操作数栈::用来存放需要cpu进行计算的基本类型和对象引用,以4个字节的slot为基本单位;
      • 局部变量表:存放当前栈帧涉及到的变量表,以4个字节的slot为基本单位;
      • 动态链接: 存放执行常量池的引用,可以实现当前方法的动态链接;
      • 方法出口:用于方法的返回,可以是异常的发生,return操作指令等等;
    • 本地方法栈:类似于虚拟机栈,但是保存的是java本地代码库的一些信息;
    • 程序计数器:保存该线程指令执行位置,待下次调度时可以接着往下执行;
      具体如下图所示:


      线程虚拟机栈结构.png

    基本类型

    java字节码中的类型表达和java代码是不一样的,在java字节码中利用如下符号来表达基本类型:

    java类型 type 含义
    boolean Z 布尔
    char C 字符
    byte B 字节
    short S 短整型
    int I 整型
    long J 长整型
    float F 浮点数
    reference L 类的引用
    void V
    double D 双精度浮点型
    Object Ljava/lang/Object; 对象
    int[] [I 整型数组
    Object[][] [[Ljava/lang/Object; 对象数组

    注: L+className;代表某类的引用(";"不能省略)

    字节码实例:

    Java代码 字节码表示 注释
    double[][] [[D
    Object run(int i,double d,Thread t) (IDLjava/lang/Thread)Ljava/lang/Object; (方法参数字节码类型)方法返回参数类型

    字节码指令操作

    字节码指令操作其实主要操作局部变量表和操作数栈,具体流程是:load局部变量到操作数栈,然后给cpu下达执行指令,然后将操作数栈栈顶元素弹出,从而实现一个操作;
    字节码指令都有一定的格式:[type+]op["_"+value];

    其中type根据基本类型可以为:i(int 整数),s(short 短整数),b(byte 字节),c(char字符),l(long长整数),d(double双精度浮点数),f(float 浮点数),a(reference 引用);
    value指的是操作数,如果操作数为负数时需要添加'm"前缀,例如iconstant_m1表示将-1压栈;如果操作数值超过一定大小,则会将该操作数存放在常量池,用#indexbyte表示其位置;
    op指的是操作码,通常用一个字节表示;

    字节码指令操作主要分为九大指令:

    • 加载和存储指令:用于将数据在操作数栈和局部变量表来回传输;
    • 运算指令:用于将操作数栈栈顶的两个数值进行运算,然后重新放入操作数栈顶;
    • 类型转换指令:用于将两个不同数值类型进行相互转换;
    • 对象创建和访问指令: 用于创建对象和访问对象
    • 操作数栈管理指令:用于管理操作数栈,类似普通栈管理
    • 控制转移指令:用于让jvm从指定位置的指令开始执行而不是控制下一条指令位置开始执行;
    • 方法调用和返回指令:用于方法调用和方法返回;
    • 异常处理指令:对jvm抛出的异常进行处理指令;
    • 方法同步指令:用来控制不同线程对方法的同步控制;

    加载和存储指令

    加载指令主要是将局部变量和常量压入到操作数栈,具体指令有:

    • 常量压栈指令,常量压栈指令时根据常量所占字节大小划分,指令如下:
      • constant:该常量字节大小为-1到5的数值,例如iconstant_0将整数0压栈,lconstant_5将长整数5压栈;
      • bipush:将字节值为byte类型的数值转换为整型,然后压栈(byte值大小为-128-127);
      • sipush:将字节值为short类型的数值转换为整型,然后压栈(short值为-32768-32767);
      • ldc: 根据指定索引值(需要一个字节存储的indexbyte)从常量池取出大小在-2147483648~2147483647的常量值,如int,float,Reference型常量值;
      • ldc_w:根据指定宽索引值(需要两个字节存储的索引值)从常量池取出如int,float,Reference等常量值进行压栈;
      • ldc2_w:根据指定宽索引值从常量池中取出如long,double等常量值进行压栈;
        如下图:


        常量压栈.png

        如上图所示,其中32767表示操作数值,在[-32768,32767]之间是不会保存到常量池的,而超过这个值则需要利用indexbyte(#30,#35)代表的索引,去常量池中查找

    • load:将局部变量指定位置(具体值或者索引)处的对象压栈;aload_0将局部变量表0处的引用类型入栈,
      iload indexbyte将局部变量表中indexbyte表示的int类型入栈;caload从char类型数组中装载指定项的值(先转换为int类型值,后压栈)
    • store :将操作数栈栈顶值弹出并保存到局部变量表中;例如:istore_3将short,byte,char,int类型保存到局部变量表3处根据类型转换,lstore [opNum] (opNum需大于3)则将long类型保存到局部变量opNum处;dstore用来保存栈顶的double类型,fstore用来保存栈顶的float类型;

    如下图所示:


    加载存储指令.png

    运算指令

    运算指令有以下几种:

    • (T)add:将栈顶T类型的两个数值相加后入栈,T:float,int,short,long,double
    • (T)sub:将栈顶T类型的两个数值相减后入栈,T:float,int,short,long,double
    • (T)mul:将栈顶T类型的两个数值相乘后入栈,T:float,int,short,long,double
    • (T)div:将栈顶T类型的两个数值相除后入栈,T:float,int,short,long,double
    • (T)rem:将栈顶T类型的两个数值取模后入栈,T:float,int,short,long,double
    • (T)neg:将栈顶T类型的取负后入栈,T:float,int,short,long,double
    • (T)iinc [indexbyte,constantbyte]:将整数值constbyte加到indexbyte指定的int类型的局部变量中;


      运算指令.png
    • (T)shl:算数左移后入栈,T为非浮点类型的基本类型;
    • (T)shr:算数左移后入栈,T为非浮点类型的基本类型;
    • (T)ushl:逻辑左移后入栈,T为非浮点类型的基本类型;
    • (T)ushr:逻辑右移后入栈,T为非浮点类型的基本类型;
    • (T)and:与操作,T为非浮点类型的基本类型;
    • (T)or:或操作,T为非浮点类型的基本类型;
    • (T)xor:异或操作,T为非浮点类型的基本类型;

    类型转换指令

    类型转换指令有以下几种:

    • (T)2(V):将T基本类型转换成V基本类型,如果是长字节类型转换短字节类型,则需要把高位字节截断;如l2i:将long转换成int则会把高4个字节截断后剩下的四个字节转换成int;

    对象创建和访问指令

    对象创建和访问指令通常需要两个操作数indexbyte1和indexbyte2

    • new :创建新的对象实例;
    • checkcast:强制类型转换;
    • instanceof:判断是否类实例;
    • getField:获取类实例字段值;
    • putField:给类实例字段赋值;
    • getStatic:获取类静态变量值;
    • putStatic:给类静态变量赋值;
    • newarray:创建基本类型数组;
    • anewarray:创建引用类型数组;
    • arraylength:获取一维数组长度;

    操作数栈管理指令

    字等于两个字节,半个slot,16位

    • nop: 空操作;
    • pop :弹出栈顶一个字长数据;
    • pop2:弹出栈顶两个字长的数据;
    • dup:复制栈顶一个字长的数据,同时将该数据入栈;
    • dup_x1:复制栈顶一个字长的数据,同时弹出栈顶两个字长的数据,然后再将复制的数据入栈,再将弹出的两个字入栈;
    • dup_x2:复制栈顶一个字长的数据,同时弹出栈顶三个字长的数据,然后再将复制的数据入栈,再将弹出的三个字入栈;
    • dup2:复制栈顶两个字长的数据,同时将该数据入栈;
    • dup2_x1:复制栈顶两个字长的数据,同时弹出栈顶三个字长的数据,然后再将复制的数据入栈,再将弹出的三个字入栈;
    • dup2_x2:复制栈顶两个字长的数据,同时弹出栈顶四个字长的数据,然后再将复制的数据入栈,再将弹出的四个字入栈;
    • swap:交换栈顶两个字长的数据,Java指令中没有提供交换两个字长为单位的交换指令;

    控制转移指令:

    控制转移指令分为跳转指令和比较指令,无条件跳转指令,表跳转指令,异常跳转指令;
    跳转指令:

    • ifeq:若栈顶int类型为0则跳转;
    • ifne:若栈顶int类型不为0则跳转;
    • iflt:若栈顶int类型小于0则跳转;
    • ifle: 若栈顶int类型小于等于0则跳转;
    • ifgt:若栈顶int类型大于0则跳转;
    • ifge:若栈顶int类型大于等于0则跳转;
    • if_icmpeq:若栈顶两int类型相等则跳转;
    • if_icmpne: 若栈顶两int类型相等则跳转;
    • if_icmplt:若栈顶int前小于后则跳转;
    • if_icpmle:若栈顶int前小于等于后则跳转;
    • if_icpmgt: 若栈顶int前大于后则跳转;
    • if_icpmge: 若栈顶int前大于等于后则跳转;
    • ifnull: 如栈顶引用为空则跳转;
    • ifnonnull:若栈顶引用不为空则跳转;
    • if_acmpeq:若栈顶两引用相等则跳转;
    • if_acmpne: 若栈顶两引用不相等则跳转;

    比较指令:

    • (T)cmp:比较栈顶两个T类型大小,前者大,则1入栈;相等则0入栈;后者大则-1入栈;
    • (T)cmpl:比较栈顶两个T类型大小,前者大,则1入栈;相等则0入栈;后者大则-1入栈;有NAN存在,则-1入栈;
    • (T)cmpg:比较栈顶两个T类型大小,前者大,则1入栈;相等则0入栈;后者大则-1入栈;有NAN存在,则-1入栈;

    无条件转移指令:

    • goto :无条件转移到指定位置;
    • goto_w:无条件转移到指定位置(宽索引);

    表跳转指令:

    • tableswitch:通过索引访问跳转表,并跳转;
    • lookupswitch: 通过健值访问跳转表,并跳转;

    异常跳转指令:

    • athrow:抛出异常;
    • jsr:跳转到指定程序;
    • jsr_w:跳转到指定程序(宽索引);
    • ret:返回到指定程序;

    方法调用和返回指令:

    • invokerspecial:指令用于调用一些需要特殊处理的实例方法,包括实例初始化方法、私有方法和父类方法,编译时绑定;
    • invokevirtual:指令用于调用对象的实例方法,根据对象的实际类型进行分派,运行时绑定;
    • invokestatic:调用静态方法;
    • invokeinterface:用以调用接口方法,在运行时搜索一个实现了这个接口方法的对象,找出适合的方法进行调用;
    • invokedynamic:用于处理新的方法分派:它允许应用级别的代码来确定执行哪一个方法调用,只有在调用要执行的时候,才会进行这种判断,从而达到动态语言的支持,lambda方法实现就是依赖于该指令;
    • (T)return:方法退出指令,T表示返回类型;
      关于invokespecial和invokevirtual如下图:


      invokespecial和invokevirtual.png

    同步方法指令:

    • monitorenter: 进入并获得对象监视器;
    • monitorexit:退出并释放对象监视器;

    相关文章

      网友评论

          本文标题:ASM框架学习(一)-基本概念

          本文链接:https://www.haomeiwen.com/subject/fjmeaqtx.html