Java是一门面向对象的编程语言,在Java程序运行的过程中无时无刻都有对象被创建出来。在语言层面上,创建对象(例如克隆、反序列化)通常仅仅是一个new关键字而已,而在虚拟机中,对象(文中讨论的对象仅限于普通的Java对象,不包括数组和Class对象等)的创建又是怎样一个过程呢?基于实用优先原则,将以常用虚拟机HotSpot和常用的内存区域Java堆为例,深入探讨HotSpot虚拟机在Java堆中对象分配,布局 和访问的过程。
对象的创建
虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符合引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化过。如果没有,那必须执行相应的类加载过程。(后面将探讨这部分内容的细节。)在类加载检查通过后,接下来虚拟机将为新生的对象分配内存。对象所需内存的大小在类加载完成后便可完全确定(下面介绍)。为对象分配空间的任务等同于把一块确定大小的内存从java堆中划分出来。
假设Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着指针作为分界点的指示器,那所有分配的内存就仅仅是把那个指针指向空闲空间那边挪动一段与对象大小相等的距离,这种分配方法称为“指针碰撞”。
如果Java堆中内存并不是规整的,已使用的内存和空闲的内存相互交错,那么就没有办法进行简单的指针碰撞了,虚拟机就必须维护一个列表,记录哪些内存块是可用的,在分配的时候从列表中找到一块足够大的内存空间划分给对象实例,并更新列表上的记录。这种分配方式成为“空闲列表”。选择哪种分配方式是由Java对是否规则决定,而Java堆是否规整又由所采用的垃圾回收器是否带有压缩整理功能决定的。
除如何划分可用空间之外,还有另外一个需要考虑的问题是对象创建在虚拟机中是非常频繁的行为,即使是仅仅修改一个指针所指向的位置,在并发情况下也并不是线程安全的,可能出现正在给A对象分配内存,指针还没来得及修改,对象B又同时使用了原来的指针来分配内存的情况。解决这个问题有两种方案,意识对内存空间的动作进行同步处理——实际上虚拟机采用CAS配上失败重试的方式保证更新操作的原子性;另一种是把内存分配的动作按照线程划分在不同的空间进行,即每个线程在Java堆中预先分配一块内存,称为本地线程分配缓冲。哪个线程需要分配内存就在哪个线程的TLAB上分配。只有TLAB分配新的TLAB时才需要同步锁定。(虚拟机是否使用TLAB,可以通过-xx:/-UseTLAB参数来决定)
内存分配完成后,虚拟机需要将分配到的内存空间都初始化为零值(不包括对象头),如果使用TLAB,这一项工作也可以提前至TLAB分配时进行。这一步操作保证了对象的实例地段在Java代码中可以不赋初始值就直接使用,程序能访问到这些字段的数据类型所对应的零值。
接下来,虚拟机要对对象进行设置,例如这个对象是哪个类的实例、如何存放在对象的对象头之中。根据虚拟机当前的运行状态不同,如是否启用偏向锁等,对象头会有不同的设置方式。
在上面的工作都完成之后,从虚拟机的视角来看,一个新的对象已经产生了。但是从Java 程序视角来看,对象创建才刚刚开始——<init>方法还没有执行,所有的字段还都是零。所以,一般来说(由字节码中是否跟随invokespecail指令所决定的)执行new指令之后会接着执行<init>方法。把对象按照程序员的意愿进行初始化,这个一个真正可用的对象才是完全产生出来。
**
网友评论