美文网首页java
作为Java开发,你应该了解的GC知识!

作为Java开发,你应该了解的GC知识!

作者: 码农小光 | 来源:发表于2019-12-30 09:15 被阅读0次

    一前言

    在JVM内存模型中会将堆内存划分新生代、老年代两个区域,两块区域的主要区别在于新生代存放存活时间较短的对象,老年代存放存活时间较久的对象,除了存活时间不同外,还有垃圾回收策略的不同,在JVM中中有以下回收算法:

    • 标记清除

    • 标记整理

    • 复制算法

    • 分代收集算法

    有了垃圾回收算法,那JVM是如果确定对象是垃圾对象的呢?判断对象是否存活JVM也会有几套自己判断算法了:

    • 引用记数

    • 可达性分析

    有了垃圾回收和判断对象存在这两个概念后,再来逐步分析它们。

    二JVM是如何判断对象是否存活的?

    要是让开发人员来判断一个对象是否有用是很简单的,简单的说就是:对象没有任何引用就认为该对象可以被回收了。假设有如下程序代码:

    <pre style="font-size: 16px; font-style: normal; font-variant-caps: normal; font-weight: normal; orphans: auto; text-indent: 0px; text-transform: none; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; text-decoration: none; margin: 0px; padding: 0px; max-width: 100%; caret-color: rgb(51, 51, 51); color: rgb(51, 51, 51); letter-spacing: 0.5440000295639038px; text-align: justify; box-sizing: border-box !important; word-wrap: break-word !important;">程序执行起来在调用checkFile的时候JVM图大概像这样:</pre>

    image

    checkFile方法执行完成之后,它里面的局部变量file就会随着栈帧一起被清理,这个时候还存活在JVM堆中的File对象也是无用的了:

    image

    要是人为来判断非常清晰的就发现File对象已经无用了,那换成JVM它又是如何来判断对象是否能存活的呢?

    2.1引用记数

    引用记数算法原理比较简单,想象下有个对象它有一个count属性,每次引用该对象都会使count加1,假设JVM在判断该对象是否存活的时候去检查这个count属性,发现这个属性不为0说明还有其他对象在引用该对象。

    image

    等到checkFile方法执行完之后count就会减1变成0:

    image

    这样一来JVM就很容易判断一个对象是否存活了。

    但是引用记数有一个明显的缺点,就是无法解决循环引用的问题比如:A --> B --> A 这样的对象关系它是没有办法来判断对象是否该不该回收的。

    2.2GC Roots(可达性分析)

    为什么会被称为可达性分析算法呢?可以这样理解如果通过GC Root能到达一个对象那么这个对象就是存活的。那什么样的对象才是GC Roots呢?

    在Java语言中,可作为GC Roots的对象包括下面几种:

    1. 虚拟机栈中引用的对象(栈帧中的本地变量表);

    2. 方法区中类静态属性引用的对象;

    3. 方法区中常量引用的对象;

    4. 本地方法栈中JNI(Native方法)引用的对象。

    还是用上面的例子,在checkFile方法执行时,因为栈帧变量file可做为GC Root所以在执行期间JVM是绝对不会回收掉这个File对象:

    image

    但是等到checkFile执行完成之后,这个栈帧会被弹出,其中的变量也会被释放,相应的没有GC Root能到达堆中的File对象,这个时候就可以判断这个对象是一个无用的对象了,然后安全回收。

    三垃圾收回算法

    垃圾回收算法有标记清除、标记整理、复制算法,几种算法都有优劣,如标记清除回收相对较快,但是会有内存碎片的问题。

    3.1标记清除

    这种算法分两分:标记、清除两个阶段, 标记阶段是从根集合(GC Root)开始扫描,每到达一个对象就会标记该对象为存活状态,清除阶段在扫描完成之后将没有标记的对象给清除掉。

    用一张图说明:

    image

    这个算法有个缺陷就是会产生内存碎片,如上图B被清除掉后会留下一块内存区域,如果后面需要分配大的对象就会导致没有连续的内存可供使用。

    3.2标记整理

    标记整理就没有内存碎片的问题了,也是从根集合(GC Root)开始扫描进行标记然后清除无用的对象,清除完成后它会整理内存。

    image

    这样内存就是连续的了,但是产生的另外一个问题是:每次都得移动对象,因此成本很高。

    3.3复制算法

    复制算法会将JVM推分成二等分,如果堆设置的是1g,那使用复制算法的时候堆就会有被划分为两块区域各512m。给对象分配内存的时候总是使用其中的一块来分配,分配满了以后,GC就会进行标记,然后将存活的对象移动到另外一块空白的区域,然后清除掉所有没有存活的对象,这样重复的处理,始终就会有一块空白的区域没有被合理的利用到。

    image

    两块区域交替使用,最大问题就是会导致空间的浪费,现在堆内存的使用率只有50%。

    3.4分代回收、

    分代回收会根据不同的区域使用不同的算法,根据区域的特性新生代对象存活时间短、存活对象少使用复制算法,老年代存活对象较多可使用标记清除算法。

    3.41新生代回收

    JVM的堆分为新生代和老年代,两种类型有不同的特性,根据它们的特性来选择不同的回收算法,这种算法会将新生代划分为一块Eden和二个Survivor区:

    image

    如上面的图有三块区域它们会按照8:1:1的比例进行分配,如1000m的堆Eden是800m,二个Survivor各占100m,那它们是如何运行的呢?

    1. 始终会有一块Survivor是空着的,内存使用率是90%

    2. 程序运行会在Eden和其中一块Survivor 1中分配内存

    3. 等到执行Minor gc,会将存活下来的对象移动到空着的Survivor 2

    4. 然后在EdenSurvivor 2中继续分配内存,Survivor 1空着等着下次使用

    这样就能使内存使用率达到90%,也不会产生内存碎片。

    3.4.2老年代回收

    老年代对象即使进行了垃圾回收,对象的存活率也高,所以采用标记清除或标记整理算法都是不错的选择,这里就不做阐述。

    相关文章

      网友评论

        本文标题:作为Java开发,你应该了解的GC知识!

        本文链接:https://www.haomeiwen.com/subject/jljkoctx.html