背景
任何软件程序都需要内存资源,而内存资源总是有限的,需要回收重复利用。
早期编程语言如C++要依靠程序员手动估算、分配和回收内存,这部分工作要求精细而且极耗精力,实际上影响了对软件真正的业务价值的实现,所以Java提出了内存托管的概念,就是由JVM来自动负责内存的分配和回收,让开发者可以专注于实现软件的业务价值。
Java的内存分配
在Java里,每个应用程序对应一个自己唯一的JVM实例,每个JVM有自己的内存区域,JVM之间互不影响。
JVM为应用程序提供的内存,常见的有这么几种:程序计数器、栈、堆、方法区。
一、程序计数器
程序计数器用来存放下一条指令(JVM需要的是.class字节码)的地址,所以空间很小。
二、栈
JVM的数据区里,有Java虚拟机栈和本地方法栈(为虚拟机使用的Native方法服务)两个栈,我们常说的栈指的是Java虚拟机栈,如果在内存里谈到栈,就是指Java虚拟机栈中的局部变量表。
其实,每个线程都有自己私有的Java虚拟机栈,这个栈是用来处理方法的,栈里对应每个方法都有一个栈帧(Stack Frame),栈帧里存放方法需要的局部变量表、方法出口等信息,线程对方法调用和执行时,对应的栈帧就会在虚拟机栈里入栈和出栈。它们的关系是这样的:

从内存的角度,栈里最重要的是局部变量表,里面存放了方法需要的所有基本类型和对象引用,因为局部变量的长度都是确定的(long和double需要2个slot,其他1个slot),所以,局部变量表在编译期间就可以确定,它的内存空间也是在编译时完成分配,方法运行期间,局部变量表的长度是不变的。
局部变量其实就是Java里的两种变量:基本类型和引用类型。二者作为局部变量,都放在局部变量表中,基本类型直接在栈中保存值,引用类型在栈里保存一个指向堆区的指针(实例),真正的对象在堆里。作为参数时基本类型就直接传值,引用类型传指针。
目前大部分JVM的堆和栈都可以动态扩展,如果线程请求的栈深度超过了虚拟机允许的栈深度,会报“StackOverflowError”。
其中,关于引用reference,有两种访问定位的方式:
-
直接指针
reference里直接存储对象在堆中的地址,如果还用到了方法区中的对象类型数据(静态变量等),那么堆里还要有指针,即到方法区中对象类型数据的指针。
来自《对象访问分析》
- 句柄
堆里有一块专门的句柄池,reference里存储的是句柄地址,reference不直接指向堆中的对象地址,而是指向句柄,句柄中指向堆中对象池中的对象实例地址,以及方法区中的对象类型数据。
来自《对象访问分析》
三、堆
Java堆是所有线程共享的内存区域,一般的应用中,堆也是最大的一块儿内存。
前面说过,引用类型在栈里保存的是一个指向堆区的指针(值是对象在堆内存中的首地址),这个指针指向的真正的对象,是放在堆中的,Java内存回收,其实主要就是针对这个堆中对象的内存回收。
Java堆只要保持逻辑连续,可以分配在物理上不连续的区域,当堆里的内存无法满足对象需求,且堆的大小无法扩展时,会报“OutOfMemoryError”。
关于栈和堆,还有这样几个不同: - 栈里实例,堆里对象
实例和对象是不同的,栈里的指针是实例,堆里的数据才是对象,所以多个实例可以指向同一个对象,如果用代码来说的话,Class a= new Class();中,a是一个实例,不是对象。 - 栈做运算,堆存数据
Java里面的数学运算都是在栈里进行的,而堆只是为开发者提供存放对象的空间。 - 销毁时机不同
栈变量和堆对象并不同步销毁,栈和生命周期在于方法,方法结束,栈中的局部变量立即销毁;堆对象首先要确保没有栈变量指向,然后在JVM执行垃圾回收时才会销毁。 - 类的变量和方法不同
类的成员变量可能有多个,它们可能指向多个对象,也就是对应堆中的多块内存;但是类的方法只有一套,为类里的所有对象共享,而且只在执行方法时入栈(这里的栈指的是Java虚拟栈,而不是常说的方法栈帧中的局部变量表,也就是内存栈),不使用时不占用内存。
四、方法区(非堆)
ClassLoader加载类时,会把.class文件格式的二进制字节流读取为当前虚拟机需要的数据格式,并放进虚拟机的内存,其实就是放进了方法区。
方法区也是所有线程共享的内存区域,这一点和堆很像,也可以是物理上不连续的内存区域,大小也可以动态扩展,也可能报“OutOfMemoryError”。
但是,方法区也叫非堆,因为它存放的是编译后的代码、类信息、常量、静态变量等。
方法区有时候也叫永久代,因为方法区主要回收常量池和类的卸载,实际上就是很少回收这个区域。
方法区里会存放运行时常量池,包括字面量和符号引用等。
关于常量池和静态域
我们在程序中经常使用final常量,如果频繁地创建和销毁常量,会影响系统性能,所以JVM里用专门的常量池来管理数据,可以节约内存(比如字符串常量池会合并字符串常量),节省时间(比如字符串之间直接用==判断是否引用,比用equals判断内容快)。
但是,常量池是最繁琐的数据,14种常量类型在常量池里都有自己的结构,其中字符串常量池还有一些很特殊的特性(后面说)。
常量又可以细分为字面量和符号引用:
- 字面量
字面量也叫直接常量,包括基本类型、String、数组等,都是开发者自己用Java语言定义的,这个好理解。 - 符号引用
符号引用和编译有关,包括类和接口的全名、方法/字段的名称和描述。
符号引用是为类的加载服务的,由于Class文件的方法/字段是动态分配的内存,所以在加载Class文件时没有方法/字段的真正的内存入口,只能先保存方法/字段的名称和描述,放在常量池中,作为符号引用,在类得到创建和运行时,方法/字段有真正的内存了,再解析翻译这些符号引用,让它们指向真正的内存。这个过程就是虚拟机加载Class文件时的动态连接。
关于运行时常量池
存放类的直接常量和符号引用,运行时常量池允许在运行期间向池里放新的常量(比如String的intern()方法)
字符串常量池比较特殊,JVM在全局只维护唯一一个字符串常量池,这其实是一个享元模式。
关于字符串常量池
字符串常量池,专门存储编译期间的字符串数据,JVM对字符串常量池做了很多特殊的优化。
首先,程序中的字符串可能在常量池,也可能在堆里,很简单,如果在代码中用双引号定义了字符串,就是直接常量,那么这个字符串在编译时就会创建,并保存在常量池中;如果是在运行中new出来,那么就是运行时,会保存在堆中。
然后,常量池会合并字符串,重复字符串在常量池中和在堆中的数量是不一样的:重复字符串(equals相等)在常量池中只有一个;但是在堆中会有多个:

这里经常有String会创建几个对象的问题,比如String s = new String("abc");类加载时,针对"abc"会在常量池里创建一个对象;类运行时针对new会在堆里创建一个对象,这样就是两个对象。
最后,字符串常量池允许在运行期间增加常量,可以用intern()向常量池增加常量,intern()函数的功能是,在运行期,判断常量池是否有某个String对象,没有则加入常量池(保证唯一),然后返回常量池中该对象的引用。
所以,对于以下代码:
String s1 = "test";
String s2 = new String("test");
String s3 = "te"+"st";
String st = "st";
String s4 = "te"+st;
String s5 = ("te"+st).intern();
s1.intern()==s1(双引号字符串本来就在常量池)
s1!=s2(new的对象在堆中)
s1==s3(+双引号字符串,视为常量)
s1!=s4(+变量,不是常量,在堆中创建)
s1==s5(intern会向常量中保存,并使用其中对应字符串常量的引用)
引用
《深入理解Java虚拟机》
Java:对象的强、软、弱和虚引用
ReferenceQueue的使用
Java 内存分配全面浅析
Java虚拟机-----方法区和运行时常量池
Java内存分配之堆、栈和常量池
Java常量池理解与总结
Java中几种常量池的区分
Class文件中的常量池详解(上)
对象访问分析
网友评论