Class 加载链接、初始化、实例化

作者: 吳志伟 | 来源:发表于2016-07-24 16:21 被阅读833次

    本文主要描述了Dalvik虚拟机中 Class加载到实例化过程。文中不贴代码,因为代码处理有些繁琐。将代码的操作过程全部抽象成图,理解起来更加直观。

    1 Odex文件布局

    • Java层创建ClassLoad并加载一个DexFile,Native层返回DexOrJar对象指针,表示 map 映射后的DexFile
    • DexFile对象中保存了map 后的 Odex 文件索引信息,在解析odex文件中 Class 时候需通过该对象来获取 Class 的具体信息
    odex文件格式.png

    2 类加载、链接、初始化

    • 加载:dalvik虚拟机分配ClassObject结构体表示一个成功加载的类,并从OdexFile中解析 Class 的相关信息:接口,方法,成员变量,静态成员等。
    • 链接:根据加载阶段获取到的类的成员信息进行链接操作,包括递归加载父类,实现的接口,并创建虚函数表,接口函数访问表,并调整实例成员的布局(为了对齐,紧凑),计算实例的大小。
    • 初始化:初始化推迟到实例对象或者第一次使用类的静态成员才进行,包括验证类,优化方法,递归初始化父类,初始化静态成员变量,执行静态代码块等操作。
    类实例化过程各个.png

    如上图“橙色”框表示了类在加载–>初始化的各个状态。要真正实例化一个类对象,该类的状态必须已经完成 load, link, init三个阶段,也即处于“CLASS_INITIALIZED"状态,该状态字段保存于ClassObject中。

    2.1 类加载、链接

    ClassObject在Load,Link完成工作如下图表示:

    • 创建虚函数表vtable,上部分继承自父类。当有覆盖方法时,直接将Method指针指向当前类的Method对象即可;
    • 非实例方法由directMethods数组表示;
    • Iftable表示所有接口入口,每个接口对应的方法都在ifvPool数组中连续表示。ifvPool中保存的是vtable数组的索引。因此,方法通过ifvPool间接映射到Method中;
    • super保存父类指针;
    • interface保存接口指针;
    • sfields[]中保存静态成员变量的信息,在Load阶段获取,并且分配好空间,在init阶段初始化;
    • objectSize是真正实例一个对象,在dalvik堆中的大小,包括继承自父类的大小,4字节对齐;
    • status 保存了该类处于的状态。
    链接_初始化.png

    2.2 类初始化

    类初始化(init)主要由2个阶段完成:

    2.2.1 阶段一

    在init阶段,虚拟机首先对类进行检查,主要是对类方法所有指令,包括参数,返回值,方法体。
    (1)方法参数检查
    参数中如果是类类型,则会检查类是否已经初始化,否则触发ClassLoad流程,加载并出示该类。如果加载失败,则用Object代替。如果连Object类(虚拟机启动阶段加载)都找不到,那直接报错返回,类初始化失败。
    (2)方法指令检查
    实例化、用类静态成员指令(如:new-instance, sget, sput, invoke-static),类型转换(check-cast),类型判断(instancd-of)指令。虚拟机判断类是否已经初始化该类,否则触发ClassLoad加载并初始化该类。另外,如果加载类失败,虚拟机会将对应指令替换为OP_THOROW_VERIFICATION_ERROR指令,当虚拟机真正执行到这条指令时,即抛找不到类的异常;
    (3)返回指令检查
    即返回指令(return-object),若检查到返回的类没有初始化,则触发ClassLoad加载该类。失败的话,则用类Object替换。
    在完成所有指令的检查后,虚拟机还会针对一些访问volitile, final修饰成员的指令进行优化,主要是替换成虚拟机内部的指令,提高性能。
    检查父类是否已经正常初始化,否则递归初始化父类。
    最后,初始化静态域,执行静态代码块,完成类的初始化。到这个阶段,就可以开始使用这个类了,如其静态成员,实例化对象。引起类初始化4条典型指令:

    • 反射机制newInstance;
    • new关键字;
    • 首次引用类静态变量,sget/sput;
    • 首次引用类静态方法,invoke-static;
      虚拟机在执行到上面4条指令,都会先判断类是否已经初始化,否则会触发类的加载初始化,失败则抛ClassNotFound的异常。newInstance,new贴一张图说明,反射机制流程请参考本文前面。
    类实例化.png

    2.2.2 阶段二

    找到类的初始化方法“<clinit>”由 静态域初始化操作,静态代码块组成,然后执行"<clinit>”初始化方法,对类的静态域进行初始化。

    2.2.3 “阶段一”不是必须的

    类始化过程中的“阶段二”是必须的,但阶段一需要试情况而定。
    分2种情况来看待。加载dex文件时,会进行opt操作,其中一个dvmVerifyClass()的操作,该操作主要针对dex中每个类中引用的类是否在同一个dex文件中进行检查:

    1. 若该类引用到了不再当前dex文件中的类,则accessFlags中不会打上CLASS_ISPREVERIFIED的标记,表示该类还没verify,在真正初始化该类时,会触发verify的操作。这种情况下,类的初始化则需经历“阶段一”,“阶段二”两个操作。
    2. 若该类内部引用到的类都在当前的dex文件中,则会在odex的accessFlags中打上CLASS_ISPREVERIFIED的标记,表示该类已verify过了,在真正初始化该类时,不需要再做verify操作。类的初始化则需要“阶段二”的操作即可。

    3 实例化

    类的实例化主要分2个步骤:

    1. 在虚拟机堆分配实例对象的空间;
    2. 执行构造函数对实例成员进行初始化(编译生成的构造函数执行顺序为:父类构造最前,其次是实例变量初始化指令,最后是程序员写的构造函数代码)。

    4 总结

    dalvik虚拟机类加载流程可分为2个大过程:

    1. 构造DexFile对象表示一个加载并且解析后的Dex文件;
    2. 构造ClassObject对象表示虚拟机成功加载的类。

    在实例化或引用引用类的静态成员,都有时机触发ClassLoad去加载尚未加载的类:

    1. 父类,接口在加载阶段会递归加载;
    2. 若该类还没verify,则 类的“方法参数”、“方法体中”、“返回值” 引用到的类都会在当前类初始化阶段加载(实例变量在构造方法中、静态成员在<clinit>方法中);
    3. 初始化阶段会递归先初始化父类。

    类在虚拟机内有9个生命期状态,主要分4个阶段:初始阶段,load,link,init。总之,在我们能够真正使用这个类的时候,类的状态会必须是在:CLASS_INITIALIZED状态,表示这个类已经初始化完成了。


    类状态.png

    相关文章

      网友评论

      • c22a3de3691f:父类,接口在加载阶段会递归加载;
        若该类还没verify,则 类的“方法参数”、“方法体中”、“返回值” 引用到的类都会在当前类初始化阶段加载(实例变量在构造方法中、静态成员在<clinit>方法中);
        初始化阶段会递归先初始化父类。

        这里有问题吧, 最近也在看dalvik虚拟机, 一起讨论下? 阿里的?
      • 5136034392fd:代码繁琐不贴代码的出发点很好
        但是建议lz可以贴核心代码路径(比如哪个源代码文件)
        吳志伟:@5136034392fd 嗯,谢谢建议。关于这个主题,我自己看完了源码,并且也写了源码的解析文档,后面自己回头看,这块源码的确有些多,而且很多代码处需要对dex文件格式很了解才能读懂,所以抽象出来,更方便理解,回顾。不过单纯是图,简单解释,可能不熟悉这块的朋友可能会有点抽象,这一点我需要改进下。

      本文标题:Class 加载链接、初始化、实例化

      本文链接:https://www.haomeiwen.com/subject/aotgjttx.html