Java虚拟机详述

作者: Q南南南Q | 来源:发表于2017-09-06 14:36 被阅读0次

一、JVM内存区域模型

JVM内存区域模型

1.堆

也叫做java 堆、GC堆是java虚拟机所管理的内存中最大的一块内存区域，也是被各个线程共享的内存区域，在JVM启动时创建。

该内存区域存放了对象实例及数组(所有new的对象)，每个对象都包含一个与之对应的class的信息。(class的目的是得到操作指令)

其大小通过-Xms(最小值)和-Xmx(最大值)参数设置，-Xms为JVM启动时申请的最小内存，默认为操作系统物理内存的1/64但小于1G，-Xmx为JVM可申请的最大内存，默认为物理内存的1/4但小于1G，默认当空余堆内存小于40%时，JVM会增大Heap到-Xmx指定的大小，可通过-XX:MinHeapFreeRation=来指定这个比列；当空余堆内存大于70%时，JVM会减小heap的大小到-Xms指定的大小，可通过XX:MaxHeapFreeRation=来指定这个比列，对于运行系统，为避免在运行时频繁调整Heap的大小，通常-Xms与-Xmx的值设成一样。

由于现在收集器都是采用分代收集，堆被划分为新生代和老年代。新生代主要存储新创建的对象和尚未进入老年代的对象。老年代存储经过多次新生代GC(Minor GC)任然存活的对象。

新生代：

程序新创建的对象都是从新生代分配内存，新生代由Eden Space和两块相同大小的Survivor Space（From Survivor Space 和 To Survivor Space）构成，可通过-Xmn参数来指定新生代的大小，也可以通过-XX:SurvivorRation来调整Eden Space及Survivor Space的大小。

由于新生代采用复制算法进行垃圾回收，根据IBM研究表明新生代中的对象98%是“朝生夕死”的，所以并不需要按照1:1的比例来划分内存空间，而是将内存分为较大的Eden Space和两块较小的Survivor Space，每次使用Eden和其中一块Survivor。当回收时，将Eden和Survivor中还存活的对象复制到另一块Survivor，最后清理掉Eden和刚才用过的Survivor。

如果-XX:SurvivorRation=8则表示Eden空间和其中一块Survivor空间大小比是8:1，也就是说新生代的可用空间是整个新生代容量的90%（80%+10%），只有10%的空间会浪费。

老年代：

用于存放经过多次新生代GC任然存活的对象，例如缓存对象，新建的对象也有可能直接进入老年代，主要有两种情况：
（1）大对象，可通过启动参数设置-XX:PretenureSizeThreshold=1024(单位为字节，默认为0)来代表超过多大时就不在新生代分配，而是直接在老年代分配
（2）大数组对象，且数组中无引用外部对象

老年代所占的内存大小为-Xmx对应的值减去-Xmn对应的值。

2. 方法区

也称"永久代” 、“非堆”，它用于存储虚拟机加载的类信息、常量、静态变量、是各个线程共享的内存区域。默认最小值为16MB，最大值为64MB，可以通过-XX:PermSize 和 -XX:MaxPermSize 参数限制方法区的大小。

3. 运行时常量池

是方法区的一部分，Class文件中除了有类的版本、字段、方法、接口等描述信息外，还有一项信息是常量池，用于存放编译器生成的字面量和符号引用，这部分内容将在类加载后放到方法区的运行时常量池中。

存放基本类型常量和字符串常量。

4. 虚拟机栈

描述的是Java方法执行的内存模型：每个方法被执行的时候都会创建一个“栈帧”用于存储局部变量表(包括参数)、操作栈、方法出口等信息。每个方法被调用到执行完的过程，就对应着一个栈帧在虚拟机栈中从入栈到出栈的过程。声明周期与线程相同，是线程私有的。

基础数据类型直接在栈空间分配。

引用数据类型，需要用new来创建，既在栈空间分配一个地址空间，又在堆空间分配对象的类变量。

局部变量 new 出来时，在栈空间和堆空间中分配空间，当局部变量生命周期结束后，栈空间立刻被回收，堆空间区域等待GC回收。

数组既在栈空间分配数组名称，又在堆空间分配数组实际的大小

方法的形式参数，直接在栈空间分配，当方法调用完成后从栈空间回收。

方法的引用参数，在栈空间分配一个地址空间，并指向堆空间的对象区，当方法调用完成后从栈空间回收。

5. 程序计数器

是最小的一块内存区域，它的作用是当前线程所执行的字节码的行号指示器，在虚拟机的模型里，字节码解释器工作时就是通过改变这个计数器的值来选取下一条需要执行的字节码指令，分支、循环、异常处理、线程恢复等基础功能都需要依赖计数器完成。

二、代码示例存储分配

JAVA的JVM的内存可分为3个区：堆(heap)、栈(stack)和方法区(method)

堆区：

存储的全部是对象，每个对象都包含一个与之对应的class的信息。(class的目的是得到操作指令)
jvm只有一个堆区(heap)被所有线程共享，堆中不存放基本类型和对象引用，只存放对象本身

栈区：

每个线程包含一个栈区，栈中只保存基础数据类型的对象和自定义对象的引用(不是对象)，对象都存放在堆区中
每个栈中的数据(原始类型和对象引用)都是私有的，其他栈不能访问
栈分为3个部分：基本类型变量区、执行环境上下文、操作指令区(存放操作指令)

方法区：

又叫静态区，跟堆一样，被所有的线程共享。方法区包含所有的class和static变量
方法区中包含的都是在整个程序中永远唯一的元素，如class，static变量

//运行时, jvm把appmain的信息都放入方法区
public class AppMain {                  
    //main 方法本身放入方法区
    public static void main(String[] args) {  
        //test1是引用，所以放到栈区里， Sample是自定义对象应该放到堆里面
        Sample test1 = new Sample("测试1");       
        Sample test2 = new Sample("测试2");    
          
        test1.printName();    
        test2.printName();    
    }    
}

//运行时, jvm 把appmain的信息都放入方法区
public class Sample {
    /** 范例名称 */
    // new Sample实例后， name 引用放入栈区里， name 对象放入堆里
    private String name; 

    /** 构造方法 */
    public Sample(String name) {
        this.name = name;
    }

    /** 输出 */
    // print方法本身放入 方法区里
    public void printName() { 
        System.out.println(name);
    }
}

行动向导图

系统收到了我们发出的指令，启动了一个Java虚拟机进程，这个进程首先从classpath中找到AppMain.class文件，读取这个文件中的二进制数据，然后把Appmain类的类信息存放到运行时数据区的方法区中。这一过程称为AppMain类的加载过程。

接着，Java虚拟机定位到方法区中AppMain类的Main()方法的字节码，开始执行它的指令。这个main()方法的第一条语句就是：

Sample test1=new Sample("测试1");

语句很简单啦，就是让java虚拟机创建一个Sample实例，并且使引用变量test1引用这个实例。貌似小case一桩哦，就让我们来跟踪一下Java虚拟机，看看它究竟是怎么来执行这个任务的：

Java虚拟机一看，不就是建立一个Sample实例吗，简单，于是就直奔方法区而去，先找到Sample类的类型信息再说。结果并没有找到，因为这会儿的方法区里还没有Sample类（Sample类没加载），于是Java虚拟机立马加载了Sample类，把Sample类的类型信息存放在方法区里。
Sample类加载好后，Java虚拟机做的第一件事情就是在堆区中为一个新的Sample实例分配内存, 这个Sample实例持有着指向方法区的Sample类的类型信息的引用。这里所说的引用，实际上指的是Sample类的类型信息在方法区中的内存地址，而这个地址呢，就存放了在Sample实例的数据区里。
在Java虚拟机进程中，每个线程都会拥有一个方法调用栈，用来跟踪线程运行中一系列的方法调用过程，栈中的每一个元素就被称为栈帧，每当线程调用一个方法的时候就会向方法栈压入一个新帧。这里的帧用来存储方法的参数、局部变量和运算过程中的临时数据。OK，原理讲完了，就让我们来继续我们的跟踪行动！位于“=”前的test1是一个在main()方法中定义的变量，可见，它是一个局部变量，因此，它被会添加到了执行main()方法的主线程的JAVA方法调用栈中。而“=”将把这个test1变量指向堆区中的Sample实例，也就是说，它持有指向Sample实例的引用。

OK，到这里为止呢，JAVA虚拟机就完成了这个简单语句的执行任务。参考行动向导图，我们终于初步摸清了JAVA虚拟机的一点点底细了，COOL！

接下来，JAVA虚拟机将继续执行后续指令，在堆区里继续创建另一个Sample实例，然后依次执行它们的printName()方法。当Java虚拟机执行test1.printName()方法时，JAVA虚拟机根据局部变量test1持有的引用，定位到堆区中的Sample实例，再根据Sample实例持有的引用，定位到方法去中Sample类的类型信息，从而获得printName()方法的字节码，接着执行printName()方法包含的指令。

三、Java虚拟机中堆和栈的区别

（1）栈(stack)与堆(heap)都是Java用来在Ram中存放数据的地方。与C++不同，Java自动管理栈和堆，程序员不能直接地设置栈或堆。

（2）栈的优势是，存取速度比堆要快，仅次于直接位于CPU中的寄存器。但缺点是，存在栈中的数据大小与生存期必须是确定的，缺乏灵活性。另外，栈数据可以共享，详见第3点。堆的优势是可以动态地分配内存大小，生存期也不必事先告诉编译器，Java的垃圾收集器会自动收走这些不再使用的数据。但缺点是，由于要在运行时动态分配内存，存取速度较慢。

（3）Java中的数据类型有两种，一种是基本类型(primitive types), 共有8种，即int, short, long, byte, float, double, boolean, char(注意，并没有string的基本类型)。这种类型的定义是通过诸如

int a = 3; 
long b = 255L;

的形式来定义的，称为自动变量。值得注意的是，自动变量存的是字面值，不是类的实例，即不是类的引用，这里并没有类的存在。如int a = 3; 这里的a是一个指向int类型的引用，指向3这个字面值。这些字面值的数据，由于大小可知，生存期可知(这些字面值固定定义在某个程序块里面，程序块退出后，字段值就消失了)，出于追求速度的原因，就存在于栈中。另外，栈有一个很重要的特殊性，就是存在栈中的数据可以共享。假设我们同时定义

int a = 3;
int b = 3;

编译器先处理int a = 3，首先它会在栈中创建一个变量为a的引用，然后查找有没有字面值为3的地址，没找到，就开辟一个存放3这个字面值的地址，然后将a指向3的地址。接着处理int b = 3；在创建完b的引用变量后，由于在栈中已经有3这个字面值，便将b直接指向3的地址。这样，就出现了a与b同时均指向3的情况。

特别注意的是，这种字面值的引用与类对象的引用不同。假定两个类对象的引用同时指向一个对象，如果一个对象引用变量修改了这个对象的内部状态，那么另一个对象引用变量也即刻反映出这个变化。相反，通过字面值的引用来修改其值，不会导致另一个指向此字面值的引用的值也跟着改变的情况。如上例，我们定义完a与 b的值后，再令a=4；那么，b不会等于4，还是等于3。在编译器内部，遇到a=4；时，它就会重新搜索栈中是否有4的字面值，如果没有，重新开辟地址存放4的值；如果已经有了，则直接将a指向这个地址。因此a值的改变不会影响到b的值。

（4）栈是线程私有的，堆是线程共享的。

四、Java代码运行过程实例

有如下代码：

代码示例

（1）运行main方法前，Test类已经加载到方法区了
（2）首先new一个Test对象，内存分配如图所示

由于Visio软件有问题了，往后在更新！

Java虚拟机详述

一、JVM内存区域模型

二、代码示例存储分配

三、Java虚拟机中堆和栈的区别

四、Java代码运行过程实例

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读