前言
C或C++开发人员,在内存管理区域,需要手动申请内存并手动释放内存,否则将出现内存泄漏等问题。
而Java虚拟机自动管理内存,不需要人为回收。不过这也是有代价的,虚拟机回收内存时会阻塞进程,如果代码不合理,回收内存频繁,性能就会受到很大影响。另外,Java也是有可能出现内存泄漏的,开发人员必须理解Java的内存使用规则,才能有效应对内存泄漏等情况。
理解Java内存使用,也会明白进程间通信与线程通信的实质。
理解Java内存使用,从下边这张图开始
java中,一个进程对应着一个虚拟机实例,每个虚拟机实例都管理着不同的内存区域。进程中存在着多个线程,不同线程会共享进程中的部分内存区域,也会存在着线程自己的专属内存区域。
程序计数器
程序计数器是一块较小的内存空间,它的作用可以看做是当前线程所执行的字节码的行号指示器。
简单理解就是指示程序运行到哪一行了或者哪个方法了,程序中判断、循环等实现,运行方法、退出方法等,都需要使用程序计数器正确指示。
它是线程私有的内存区域,也是虚拟机中唯一不会出现oom的区域。
Java虚拟机栈
Java虚拟机栈也是线程私有的内存区域
每个方法在运行时都会同时创建一个栈帧,用于存储局部变量表、操作栈、动态链接、方法出口等消息。每一个方法被调用直至执行完成的过程,就对应着一个栈桢在虚拟机栈中从入栈到出栈的过程。
局部变量表存放了预编译期可知的各种基本数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型)和returnAddress类型(指向了一条字节码指令的地址)。其中64位长度的long和double类型的数据会占用2个局部变量空间(Slot),其余的数据类型只占用1个。局部变量空间是以Slot(32位)为空间单位的。就算原本一字节大小的byte类型在局部变量表也要占一个Slot。
注意对象引用不是对象本身,对象引用根据不同虚拟的不同实现,存储着对象的指针或名柄。
在Java虚拟机规范中,Java虚拟机栈规定了两种异常情况:如果线程请求的栈深度大于虚拟机所允许的深度,将抛出StackOverflowError异常;如果虚拟机栈可以动态扩展,如果扩展时无法申请到足够的内存,就会抛出OutOfMemoryError异常。
如果线程栈的大小有1MB,如果当前线程大量使用了递归,那么当线程的栈帧总和超过1MB,JVM就会抛出StackOverflowError。另外,创建线程数量是需要分配线程栈内存的,但系统没有内存可以分配时,就会抛出OutOfMemoryError。
private int stackLength = 1;
public void stackLeak(){
stackLength ++;
stackLeak();
}
/**
* 测试栈溢出
* 测试参数为:-verbose:gc -Xms20M -Xmx20M -Xmn10M -Xss128K -XX:+PrintGCDetails -XX:SurvivorRatio=8
*/
public static void testStackOOM(){
DemoMemory memory = new DemoMemory();
memory.stackLeak();
}
上面的代码可以模拟StackOverflowError。
本地方法栈对应着非Java代码,和Java虚拟机栈类似,不再详述。
Java堆
Java堆,是虚拟机所管理的内存中最大的一块区域,并且它是被各线程所共享的,在虚拟机启动时创建。此区域唯一目的就是存放对象实例,所有的对象实例及数组均在堆上分配。
Java堆如果没有足够的内存分配,将出现OutOfMemoryError异常。
/*
* 测试堆内存溢出
* 测试参数为:-verbose:gc -Xms20M -Xmx20M -Xmn10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
*/
private static void testHeapOOM(){
List<OOMObject> list = new ArrayList<>();
while (true) {
list.add(new OOMObject());
}
}
Java堆是垃圾收集器管理的主要区域,如果从内存回收的角度讲,现在的收集器基本采用分代收集算法,所以Java堆还可以细分为:新生代和老年代,再细致一点的有Eden空间,From Survivor空间,To Survivor空间等。
注意:有些版本的JDK已经没有Permanent(永久代)了。
方法区
方法区,与java堆一样,也是各线程所共享的,它存储着已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
运行时常量池(Runtime Constant Pool)是方法区的一部分,用于存放Class文件在编译期生成的各种字面量和符号引用,因为Class文件除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table)。这部分内容将在类加载后进入方法区的运行时常量池中存放。同时运行时常量池具备动态性,并非预置入Class文件中常量池的内存才能进入方法区运行时常量池,运行期间也可能将新的常量放入池中,例如String类的inter()方法。既然运行时常量池是方法区的一部分,自然受到方法区内存限制,当常量池无法再申请到内存时会抛出OutOfMemoryError异常。
如下代码可制造出内存溢出。
/**
* 测试运行时常量池内存溢出
* -verbose:gc -Xms40M -Xmx40M -Xmn20M -XX:PermSize=10M -XX:MaxPermSize=10M -XX:+PrintGCDetails -XX:SurvivorRatio=8
*/
public static void testConstantOOM(){
List<String> list = new ArrayList<>();
int i = 0;
while (true) {
list.add(String.valueOf(i++).intern());
}
}
调试参数
- -Xms20M:设置堆最小值为20M,也是java堆的初始化大小
- -Xmx20M:设置堆最大值为20M,注意以上参数后面必须无空格加数字,否则会报错。
- -Xss128K:设置java栈大小为128k
- -XX:MaxPermSize:设置方法区最大值
结束语
在前言中提到,理解Java内存区域有助于发现进程通信的实质。为何进程通信这么麻烦呢?那是因为内存区域都不一样了,进程A向进程B发送一个字符串,B怎么知道A发送的就是字符串呢?如果不是发送字符串,而是发送的任意一个自定义类的实例,B要怎么将A发送的数据转换成正确的类实例呢?所以进程通信间的数据,都要实现序列化接口。
另外对象的访问也是值得一提的,方法执行时会在Java虚拟机栈中生成栈桢,栈桢里存储的只是对象的引用,对象的访问都是通过访问存在栈中的对象引用,去访问存在堆中的对象实例。
网友评论