java虚拟机栈:
每个方法执行时创建栈帧,存储局部变量表,操作数栈,动态链接,方法出入口等信息。一个方法调用到完成过程,就是一个栈帧在虚拟机栈中入到到出栈过程。
局部变量表存放编译器可知的基本数据类型、对象引用(reference类型)和returnAddress类型(指向了一条字节码指令的地址)
64位的long和double类型占用两个局部变量空间(slot),其余类型只占用一个。局部变量表需要内存空间在编译期间完成分配,进入一个方法时,这个方法需要在帧中分配多大局部变量表示确定的,方法运行期间不会改变局部变量表大小。
在栈区域规定了两种异常:
如果线程请求栈深度大于虚拟机允许的深度,抛出stackoverflowerror异常
如果虚拟机可以动态扩展(大部分都可以),如果扩展时无法申请到足够内存,抛出outofmemoryerror异常
java堆:
可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。通过-Xms -Xmx实现可扩展。如果堆中没有内存完成实例分配,并且堆无法再扩展时,抛出oom异常
方法区:
和堆一样,各个线程共享,存储已经被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。java虚拟机规范将方法区描述为堆的一个逻辑部分,但是它却有一个别名Non-heap(非堆),目的应该是和堆区分出来。
方法区和永久代并不等价。只是因为hotspot虚拟机设计团队选择将gc分代收集扩展至方法区,或者说用永久代实现方法区而已,这样hotspot垃圾收集器可以像管理java堆一样管理这部分内存,省去专门为方法区编写内存管理的代码。对其他虚拟机(如bea jrockit)不存在永久代概念。
使用永久代实现方法区并不合适,容易内存溢出,永久代有-XX:MaxPermSize的上限,J9和JRockit只要没到进程可用内存上限(如32位4Gb)就不会有问题。而从jdk1.7的hotspot开始,已经把原本在永久代的字符串常量池移出。
方法区和堆一样不需要连续内存,可以选择固定大小或可扩展,另外还可以选择不实现垃圾回收。无法满足内存分配抛出oom.
运行时常量池:
方法区一部分。class文件中除了有类版本,字段,方法,接口等描述信息外,还有一项信息是常量池(constant pool table),用于存放编译期生成的字面量和符号引用,这部分将在类加载后进入方法区的运行时常量池中存放。
运行时常量池相对class常量池一个特征就是具有动态性,java并不要求常量只有编译期才能产生,就是并非预置入class文件中常量池的内容才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,比如String类的intern()方法。
直接内存:
直接内存(Direct Memory)不是虚拟机运行时数据区的一部分,也不是java虚拟机规范中定义的内存区域,但这部分内存也可能导致oom。
jdk1.4中加入了nio(new input/output)类,引入了基于通道(channel)与缓冲区(buffer)的I/O方法,使用native函数库分配堆外内存,通过java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。在一些场合可以提高性能,因为避免了java堆和native堆中来回复制数据。
对象的创建
虚拟机遇到一条new指令时,首先将去检查这个指令是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已经被加载、解析和初始化过,如果没有,那必须先执行相应的类加载过程。在类加载检查通过后,虚拟机将为新生对象分配内存,对象所需的内存大小在类加载完成后便可以确定。
java划分堆的方式:
指针碰撞:如果java堆内存规整,用过的内存放一边,空闲的另一边,中间放指针做分界点指示器,那内存分配就只需要向空闲区挪动指针和对象大小相等距离。
空闲列表:不规整,维护一个列表,记录那些内存块可用。
java堆是否规整由垃圾收集器是否由压缩整理功能决定。使用Serial,parnew带compact过程的收集器时,采用指针碰撞。使用cms这种基于mark-sweep算法的收集器,采用空闲列表。
并发情况下移动指针有安全问题:
1.对分配内存空间动作进行同步处理,使用cas配失败重试保证更新原子性。
2.把内存分配的动作按照线程划分在不同空间中进行,每个线程在java堆中分配一小块内存,称为本地线程分配缓冲(Thread Local Allocation Buffer,TLAB)。哪个线程要分配内存,就在哪个线程的TLAB上分配,只有TLAB用完并分配新的TLAB时,才需要同步锁定。是否使用TLAB通过-XX:+/-UseTLAB参数来设定。
JVM在内存新生代Eden Space中开辟了一小块线程私有的区域,称作TLAB(Thread-local allocation buffer)。默认设定为占用Eden Space的1%。在Java程序中很多对象都是小对象且用过即丢,它们不存在线程共享也适合被快速GC,所以对于小对象通常JVM会优先分配在TLAB上,并且TLAB上的分配由于是线程私有所以没有锁开销。因此在实践中分配多个小对象的效率通常比分配一个大对象的效率要高。
也就是说,Java中每个线程都会有自己的缓冲区称作TLAB(Thread-local allocation buffer),每个TLAB都只有一个线程可以操作,TLAB结合bump-the-pointer技术可以实现快速的对象分配,而不需要任何的锁进行同步,也就是说,在对象分配的时候不用锁住整个堆,而只需要在自己的缓冲区分配即可。
接下来,虚拟机对对象进行必要的设置,如对象是哪个类实例,如何找到类元数据信息,对象哈希码,对象GC分代年龄等信息。这些信息存放在对象头中(Object Header).
上面工作完成后,从虚拟机视角看,一个新对象已经产生,但java视角对象创建才开始,<init>方法还未执行,字段还为零。所以一般来说(由字节码是否跟随invokespecial指令决定),new指令后会接着执行<init>方法初始化,可用对象才算产生。
对象结构
hotspot虚拟机中,对象分为三块区域:对象头(Header),实例数据(Instance Data),对齐填充(Padding)
对象头包括两部分:1.用于存储对象自身的运行时数据。如哈希码,GC分代年龄,锁状态标志,线程持有的锁,偏向线程ID,偏向时间锁等。官方称为Mark Word
2.类型指针。即对象指向它的类元数据的指针,虚拟机通过这个指针确定这个对象是哪个类的实例。
对齐填充仅仅占位符作用,用于补齐没有对齐的实例数据部分(对象大小必须8字节整数倍)。
对象的访问定位
句柄:会在堆中划分句柄池,ref存储对象的句柄池地址,句柄中包括对象实例数据和类型数据的地址。
直接指针:ref存储的直接就是对象地址。
句柄好处:对象移动(gc)时候只需要改变句柄的实例数据指针,ref本身不变。
直接指针:访问速度快,节省一次指针定位开销。hotspot使用这种。
网友评论