JVM(3)类加载机制

作者: 桥头放牛娃 | 来源:发表于2019-06-17 07:42 被阅读4次

    1、类加载的时机

    类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载( Loading )、验证( verification )、准备( Preparation )、解析( Resolution )、初始化 ( Initialization )、使用( Using )和卸载( Unloading ) 7 个阶段。其中验证、准备、解析 3 个部分统称为连接( Linking ) 。

    类加载过程.png

    加载、验证、准备、初始化和卸载这 5 个阶段的顺序是确定的,类的加载过程必须按照这种顺序按部就班地开始,而解析阶段则不一定:它在某些情况下可以在初始化阶段之后再开始,这是为了支持 Java 语言的运行时绑定(也称为动态绑定或晚期绑定)。

    类在如下五种情况进行初始化:

    • 遇到 new 、 getstatic 、 putstatic 或 invokestatic 这 4 条字节码指令时,如果类没有进行过初始化,则需要先触发其初始化。生成这 4 条指令的常见的 Java 代码场景是:使用 new 关键字实例化对象的时候、读取或设置一个类的静态字段(被 final修饰、已在编译期把结果放入常量池的静态字段除外)的时候,以及调用一个类的静态方法的时候。
    • 使用 java.lang.reflect 包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化。
    • 当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化。
    • 当虚拟机启动时,用户需要指定一个要执行的主类(包含 maln ( )方法的那个类),虚拟机会先初始化这个主类。
    • 当使用 JDK 1.7 的动态语言支持时,如果一个 java.lang.invoke.MethodHandle 实例最后的解析结果 REF_getstatic 、 REF_putstatic 、 REF_invokestatic 的方法句柄,并且这个方法句柄所对应的类没有进行过初始化,则需要先触发其初始化。

    2、类加载的过程

    2.1、加载

    在加载阶段,虚拟机需完成如下三件事:

    • 通过一个类的全限定名来获取定义此类的二进制字节流。
    • 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
    • 在内存中生成一个代表这个类的 java . lang . Class 对象,作为方法区这个类的各种数据的访问人口。

    数组的加载方式不同,其本身不通过类加载器加载,而是由java虚拟机直接创建的。但数组的元数据类型最终也是通过类加载器创建。

    数组创建过程如下:

    • 如果数组的组件类型是引用类型,那就递归采用通用加载过程来加载组件类型,数组将在加载该组件类型的类加载器的类名空间中被唯一标识。
    • 如果数组的组件类型不是引用类型(例如 init[]数组) , Java 虚拟机将会把数组标记为与引导类加载器关联。
    • 数组类的可见性与它的组件类型的可见性一致,如果组件类型不是引用类型,那数组类的可见性将默认为 public 。

    加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中,方法区中的数据存储格式由虚拟机实现自行定义,虚拟机规范未规定此区域的具体数据结构。然后在内存中实例化一个 java . lang . class 类的对象 , 这个对象将作为程序访问方法区中的这些类型数据的外部接口.

    2.2、验证

    验证阶段是为了确保 Class 文件的字节流中包含的信息符合当前虚拟机的要求,井且不会危害虚拟机自身的安全。 Java 语言本身是相对安全的语言(依然是相对于 C / C + +来说),使用纯粹的J ava 代码无法做到如访问数组边界以外的数据、将一个对象转换为它并未实现的类型、跳转到不存在的代码行之类的事情,如果这样做了,编译器将拒绝编译。

    验证阶段是非常重要的,这个阶段是否严谨,直接决定了 Java虚拟机是否能承受恶意代码的攻击,从执行性能的角度上讲,验证阶段的工作在虚拟机的类加载子系统中占了很大的一部分。

    从整体上看验证阶段大致会完成下面 4 个阶段的检验动作:文件格式验证、元数据验证、字节码验证、符号引用验证。

    2.2.1、文件格式验证

    第一阶段要验证字节流是否符合 Class 文件格式的规范,并且能被当前版本的虚拟机处理。这一阶段可能包括下面这些验证点:

    • 是否以魔数 0xCAFEBABE 开头。
    • 主、次版本号是否在当前虚拟机处理范围之内。
    • 常量池的常量中是否有不被支持的常量类型(检查常量 tag 标志)。
    • 指向常量的各种索引值中是否有指向不存在的常址或不符合类型的常址 。
    • CONSTANT_Utf8_info型的常量中是否有不符合 UTF8 编码的数据。
    • Class 二文件中各个部分及文件本身是否有被删除的或附加的其他信息。

    实际上验证阶段远不止这些,以面这些只是从 Hotspot虚拟机源码中摘抄的一小部分内容,该验证阶段的主要日的是保证输人的字节流能正确地解析并存储于方法区之内,格式上符合描述一个 Java 类型信息的要求。这阶段的验证是基于二进制字节流进行的,只有通过这个阶段的验证后,字节流才会进人内存的方法区中进行存储,所以后面 3 个验证阶段全部是基于方法区的储结构进行的,不会再直接操作字节流。

    2.2.2、元数据验证

    此阶段是对字节码描述的信息进行语义分析,以保证其描述的信息符合 Java 语言规范的要求,这个阶段可能包括的验证点如下:

    • 这个类是否存父类(除了 java . lang.Object 之外,所有的类都应当有父类)。
    • 这全类的父类足否继承了不允许被继承的类(被final修饰的类)。
    • 如果这个类不是抽象类,是否实现了其父类或接口之中要求实现的所有方法。
    • 类中的字段、方法是否与父类产生矛盾(例如覆盖了父类的 final字段,或者出现不符合规则的方法重载,例如方法参数都一致,但返回值类型却不一样等)。

    第二阶段的主要目的是对类的元数据信息进行语义校验,保证不存在不符合 Java 语言规范的元数据信息。

    2.2.3、字节码验证

    此阶段主要是通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。

    会做如下验证:

    • 保证任何时刻操作数栈的数据类型与指令代码序列都能配合工作,例如不会出现在操作栈放置了一个int类型的数据,使用时却按long类型来加载到本地变量表中。
    • 保证跳转指令不会跳转到方法体以外的字节码指令上。
    • 保证方法体中的类型转换是有效的,例如可以把一个子类对象赋值给父类数据类型,这是安全的,但是把父类对象赋值给子类数据类型,甚至把对象赋值给与它毫无继承关系、完全不相干的一个数据类型,则是危险和不合法的。

    2.2.4、符号引用验证

    此阶段的校验发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在连接的第三阶段—解析阶段中发生。符号引用验证可以行做是对类自身以外(常量池中的各种符号引用)的信息进行匹配性校验,通常需要校验下列内容:

    • 符号引用中通过字符串描述的全限定名是否能找到对应的类。
    • 在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段。
    • 符号引用中的类、字段、方法的访问性( private 、 protected 、 public 、 default )是否可被当前类访问。

    2.3、准备

    准备阶段是正式为类分配内存并设置类变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。这个阶段的内存分配仅包括类变量(即静态变量),而不包括实例变量,实例变量将在对象实例化时随对象一起分配在java堆中。

    2.4、解析

    解析是虚拟机将常量池内的符号引用替换为直接引用的过程。

    符号引用:符号引用是以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义第定位到目标即可。

    直接引用:直接引用可以是直接指向目标的指针、相对偏移量或是一个能间接定位到目标的句柄。

    2.5、初始化

    此阶段根据程序人员制定的主观计划去初始化类变量和其他资源,<clinit>()方法在此阶段执行。

    <clinit>()方法有如下特点:

    • 其是由编译器自动收集类中的所有类变量的赋值动作和静态语句块中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序所决定的,静态语句块中只能访问到定义在静态语句块之前的变量,定义在它之后的变量,前面的静态语句块可以赋值,但不能访问。
    • 此方法与类的构造函数不同,它不需要显示的调用父类构造器,虚拟机会保证在子类的<clinit>()方法执行之前,父类的<clint>()方法已经执行完毕。故虚拟机中第一个被执行的<clint>()方法是java.lang.Object。
    • 因父类的<clinit>()方法先执行,也就意味着父类中定义的静态语句块要优于子类的变量赋值操作。
    • <clinit>()方法对于类或接口来说并不是必须的,如果一个类中没有静态语句块,也没有对变量的赋值操作,那么编译器可以不为这个类生成<clinit>()方法。
    • 接口中不能使用静态语句块,但可以有变量的初始化赋值操作。故接口会生成<clinit>()方法。但执行接口的<clinit>()方法不需要先执行父接口的<clinit>()方法。
    • 虚拟机保证一个类的<clinit>()方法在多线程环境中被正确地加锁、同步,如果多个线程同时初始化一个类,那么只会有一个线程去执行这个类此<clinit>()方法,其他变成会阻塞等待,直到<clinit>()方法执行完毕。

    3、类加载器

    3.1、双亲委派模型

    双亲委派模型.png
    • 启动类加载器(Bootstrap ClassLoader):此加载器负责将存放在<JAVA_HOME>\lib目录中的,或者被-Xbootclasspatch参数所指定的路径中的,并且是是虚拟机识别的(仅按照文件名识别,如 rt.jar ,名字不符合的类库即使放在 Iib 目录中也不会被加载)类库加载到虚拟机内存中。启动类加载器无法被 Java 程序直接引用,用户在编写自定义类加载器时,如果需要把加载请求委派给引导类加载器,那直接使用 null 代替即可。
    • 扩展类加载器(Extension ClassLoader):这个加载器由 sun.misc.Launcher$ExtClassLoader实现,它负责加载<JAVA_HOME>\lib\ext目录中的,或者被 java.ext.dirs系统变量所指定的路径中的所有类库,开发者可以直接使用扩展类加载器。
    • 应用程序类加载器( Application ClassLoader ) :这个类加载器由 sun.misc.Launcher$AppClassLoader实现。由于这个类加载器是 classLoader 中的 getSystemClassLoader()方法的返回值,所以一般也称为系统加载器。它负责加载用户类路径(ClassPach)上所指定的类库,开发者可以直接使用这个类加载器,如果应用程序中没有自定义过自己的类加载器,一般情况下就是用此类加载器。

    3.2、双亲委派模型的工作过程

    如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父类加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父加载器反馈自己无法完成这个加载请求(它的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去加载。

    使用双亲委派模型来组织类加载器之间的关系,有一个显而易见的好处就是 Java 类随着它的类加载器一起其备了一种带有优先级的层次关系。例如类 java . lang . Object ,它存放在 rt . jar 之中,无论哪一个类加载器要加载这个类,最终都是委派给处于模型最顶端的启动类加载器进行加载,因此 Object 类在程序的各种类加载器环境中都是同一个类。相反,如果没有使用双亲委派模型,由各个类加载器自行去加载的话,如果用户自己编写了一个称为 java . lang . Objcct 的类,并放在程序的 ClassPath 中,那系统中将会出现多个不同的 Object 类, Java类型体系中最基础的行为也就无法保证,应用程序也将会变得一片混乱。

    相关文章

      网友评论

        本文标题:JVM(3)类加载机制

        本文链接:https://www.haomeiwen.com/subject/czhofctx.html