美文网首页
一文吃透JVM分代回收机制(以SerialGC为例)

一文吃透JVM分代回收机制(以SerialGC为例)

作者: 戎码益深 | 来源:发表于2019-03-17 19:39 被阅读0次

    Java GC发展至今,已经推出了好几代收集器,包括Serial、ParNew、Parallel、CMS、G1以及Java11中最新的ZGC。每一代GC都对前一代存在的问题做出了很大的改善。

    今天介绍一个古董收集器-Serial串行GC。

    虽然此收集器的使用场景已经不多,但本文通过这个收集器,说明了如何分配每一块堆内存的大小,并根据GC日志,详细说明了Serial GC在新生代和老年代的GC过程。

    Serial GC的名字能很好地概括他的特点:串行。它与应用线程的执行是串行的,也就是说,执行应用线程的时候,不会执行GC,执行GC的时候,不能执行应用线程。

    所以,整个Java进程执行起来就行下面的样子:

    Serial GC使用的是分代算法,在新生代上,Serial使用复制算法进行收集,在老年代上,Serial使用标记-压缩算法进行收集。

    分代算法、复制算法、标记-压缩请移步:

    Java虚拟机-GC垃圾回收算法-标记清除法、复制算法、标记压缩法、分代算法

    1 Serial存在的问题

    如上图所示,在需要执行GC时,GC线程会阻塞所有用户线程(Stop-The-world,简称STW),等他执行完,才会恢复用户线程。

    这对我们的应用程序来说,每次GC是都会造成不同程度的卡顿,对用户是极为不友好的。

    2 使用场景

    个人观点:

    首先,根据其特点,回收算法简单,所以回收效率高。

    其次,它是单线程收集的,不存在GC线程之间的切换。由于Java的线程切换是需要系统内核来调度的,在单线程下,可以很大程度的减少调度带来的系统开销。

    所以,也许在单核CPU机器上,且业务场景为只对公司内部使用且可以忍受STW带来的卡顿的情况下,有一些用武之地。

    3 实战

    环境:

    CPU:i7 4核

    内存:16G

    JDK version:8

    3.1 先来看一下默认情况下,使用的哪个GC

    添加下面JVM参数并运行代码,观察GC日志

    /**

    * JVM参数:

    * -XX:+PrintGCDetails -XX:+PrintGCTimeStamps

    */

    public static void main(String[] args) {

        System.out.println("Hello SerialGC");

    }

    程序输出如下

    Hello SerialGC

    // 下面是GC日志

    Heap

    PSYoungGen      total 76288K, used 6554K [0x000000076b180000, 0x0000000770680000, 0x00000007c0000000)

      eden space 65536K, 10% used [0x000000076b180000,0x000000076b7e6930,0x000000076f180000)

      from space 10752K, 0% used [0x000000076fc00000,0x000000076fc00000,0x0000000770680000)

      to  space 10752K, 0% used [0x000000076f180000,0x000000076f180000,0x000000076fc00000)

    ParOldGen      total 175104K, used 0K [0x00000006c1400000, 0x00000006cbf00000, 0x000000076b180000)

      object space 175104K, 0% used [0x00000006c1400000,0x00000006c1400000,0x00000006cbf00000)

    Metaspace      used 3458K, capacity 4496K, committed 4864K, reserved 1056768K

      class space    used 381K, capacity 388K, committed 512K, reserved 1048576K

    PSYoungGen:表示年轻代使用的是ParallelGC

    ParOldGen:表示老年代使用的是ParallelGC

    Metaspace:元数据区使用情况

    可见,在多核情况下,JVM默认选用了支持多线程并发的ParallelGC。

    3.2 Serial GC是运行在Client模式下的默认收集器?

    周志明老师的书中提到过,SerialGC仍然是-client模式下默认的收集器。

    下面来实验一下,刚才的JVM启动参数加上-client参数

    /**

    * JVM参数:

    * -client -XX:+PrintGCDetails -XX:+PrintGCTimeStamps

    */

    public static void main(String[] args) {

        System.out.println("Hello SerialGC");

    }

    运行结果如下:

    Hello SerialGC in client mode

    Heap

    PSYoungGen      total 76288K, used 6554K [0x000000076b180000, 0x0000000770680000, 0x00000007c0000000)

      eden space 65536K, 10% used [0x000000076b180000,0x000000076b7e6930,0x000000076f180000)

      from space 10752K, 0% used [0x000000076fc00000,0x000000076fc00000,0x0000000770680000)

      to  space 10752K, 0% used [0x000000076f180000,0x000000076f180000,0x000000076fc00000)

    ParOldGen      total 175104K, used 0K [0x00000006c1400000, 0x00000006cbf00000, 0x000000076b180000)

      object space 175104K, 0% used [0x00000006c1400000,0x00000006c1400000,0x00000006cbf00000)

    Metaspace      used 3513K, capacity 4498K, committed 4864K, reserved 1056768K

      class space    used 387K, capacity 390K, committed 512K, reserved 1048576K

    这个原因应该是由于,在JDK1.8下,-client和-server参数默认都是失效的,所以指定-client也无济于事。

    其实笔者也在相同的环境下尝试了JDK6和JDK7,也同样不是SerialGC,所以猜想可能是老版本的单核CPU情况下,JVM会默认选择SerialGC,但这一点笔者尚未查证。

    PS:-client和-server

    -client和-server参数在之前版本的JDK中是用来选择JVM运行过程中使用的编译器的。对启动性能有要求的程序,可使用-client,对应的编译器为编译效率较快C1,对峰值性能有要求的程序,可使用-server,对应生成代码执行效率较快的C2(参考了郑雨迪老师在极客时间推出的课程)。

    Java8会默认使用分层编译的机制,会自动选择在何时使用哪个编译器,所以client和server参数在默认情况下失效。相对之前的JDK版本,JDK8的这种机制很大程度地提升了代码的编译执行效率。

    3.3 Serial GC实战 - JVM参数

    本小节说明了如何配置堆内存中每一块内存的大小。

    首先我们要明确需要指定哪几块内存。因为Serial GC是分代收集,所以要确认新生代和老年代的大小,其中,新生代又需要确认Eden区和Survivor区的大小。

    定义整个堆内存的大小

    // -Xmx:最大堆内存,-Xms:最小堆内存,这里设置为一样的,表示堆内存固定200M

    -Xmx200M -Xms200M

    定义新生代和老年代的大小

    // NewRatio表示老年代和新生代的比例,3表示3:1

    // 即把整个堆内存分为4份,老年代占3份,新生代1份

    // 目前堆内存为200M,NewRatio=3时,新生代=50M,老年代=150M

    -XX:NewRatio=3

    配置GC日志打印参数

    // SurvivorRatio表示Eden区和两个Survivor区的比例,3表示3:2(注意是两个Survivor区)

    // 即把新生代分为5份,Eden占3份,Survivor区占2份

    // 目前新生代为50M,Survivor=3时,Eden=30M,Survivor=20M(from=10M, to=10M)

    -XX:SurvivorRatio=3

    实践

    依然用上面的Hello SerialGC程序,运行结果如下

    Hello SerialGC

    Heap

    // def new generation表明新生代使用SerialGC,total:40M,已使用:4302K

    // total少了10M?这是因为新生代使用复制算法,From区和to区实际上每次只能使用1个,所以是eden的30M + from或to的10M = 40M

    def new generation  total 40960K, used 4302K [0x00000000f3800000, 0x00000000f6a00000, 0x00000000f6a00000)

      // eden区30M

      eden space 30720K,  14% used [0x00000000f3800000, 0x00000000f3c33b78, 0x00000000f5600000)

      // from区10M

      from space 10240K,  0% used [0x00000000f5600000, 0x00000000f5600000, 0x00000000f6000000)

      // to区10M

      to  space 10240K,  0% used [0x00000000f6000000, 0x00000000f6000000, 0x00000000f6a00000)

    // 老年代使用 SerialGC ,总大小150M,已使用0K

    tenured generation  total 153600K, used 0K [0x00000000f6a00000, 0x0000000100000000, 0x0000000100000000)

      the space 153600K,  0% used [0x00000000f6a00000, 0x00000000f6a00000, 0x00000000f6a00200, 0x0000000100000000)

    // 元数据区大小,暂不关注

    Metaspace      used 3450K, capacity 4496K, committed 4864K, reserved 1056768K

      class space    used 380K, capacity 388K, committed 512K, reserved 1048576K

    关于复制算法,请移步:

    复制算法

    3.4 Serial GC实战 - 通过GC日志理解新生代老年代的GC过程

    此实验在上述JVM参数配置条件下运行。

    下面通过一个实例程序,来观察一下

    public class SerialGCDemo {

        /**

        * 堆内存:-Xmx200M -Xms200M

        * 新生代:-XX:NewRatio=3 -XX:SurvivorRatio=3

        * GC参数:-XX:+UseSerialGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps

        * 堆空间:200M,新生代:50M,老年代:150M,新生代eden区:30M,新生代from区:10M,新生代to区:10M

        * -Xmx200M -Xms200M -XX:NewRatio=3 -XX:SurvivorRatio=3 -XX:+UseSerialGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps

        * @param args

        */

        public static void main(String[] args) {

            byte[][] useMemory = new byte[1000][];

            Random random = new Random();

            for (int i = 0; i < useMemory.length; i++) {

                useMemory[i] = new byte[1024 * 1024 * 10]; // 创建10M的对象

                // 20%的概率将创建出来的对象变为可回收对象

                if (random.nextInt(100) < 20) {

                    System.out.println("created byte[] and set to null: " + i);

                    useMemory[i] = null;

                } else {

                    System.out.println("created byte[]: " + i);

                }

            }

        }

    }

    整体日志输入如下:

    created byte[]: 0

    created byte[]: 1

    0.236: [GC (Allocation Failure) 0.236: [DefNew: 24807K->870K(40960K), 0.0132148 secs] 24807K->21350K(194560K), 0.0132618 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]

    created byte[]: 2

    created byte[] and set to null: 3

    0.252: [GC (Allocation Failure) 0.252: [DefNew: 21941K->717K(40960K), 0.0060942 secs] 42421K->31437K(194560K), 0.0061231 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

    created byte[]: 4

    created byte[]: 5

    0.259: [GC (Allocation Failure) 0.259: [DefNew: 22408K->717K(40960K), 0.0114560 secs] 53128K->51917K(194560K), 0.0114856 secs] [Times: user=0.00 sys=0.02, real=0.02 secs]

    created byte[]: 6

    created byte[]: 7

    0.285: [GC (Allocation Failure) 0.285: [DefNew: 21788K->717K(40960K), 0.0122524 secs] 72988K->72397K(194560K), 0.0122868 secs] [Times: user=0.00 sys=0.00, real=0.01 secs]

    created byte[]: 8

    created byte[]: 9

    0.299: [GC (Allocation Failure) 0.299: [DefNew: 21790K->717K(40960K), 0.0115042 secs] 93470K->92877K(194560K), 0.0115397 secs] [Times: user=0.03 sys=0.00, real=0.02 secs]

    created byte[]: 10

    created byte[]: 11

    0.312: [GC (Allocation Failure) 0.312: [DefNew: 21791K->717K(40960K), 0.0120174 secs] 113952K->113357K(194560K), 0.0120525 secs] [Times: user=0.00 sys=0.00, real=0.01 secs]

    created byte[]: 12

    created byte[]: 13

    0.328: [GC (Allocation Failure) 0.328: [DefNew: 21792K->717K(40960K), 0.0162437 secs] 134432K->133837K(194560K), 0.0162844 secs] [Times: user=0.00 sys=0.01, real=0.02 secs]

    created byte[]: 14

    created byte[]: 15

    0.347: [GC (Allocation Failure) 0.347: [DefNew: 21793K->21793K(40960K), 0.0000201 secs]0.347: [Tenured: 133120K->143360K(153600K), 0.0103885 secs] 154913K->154316K(194560K), [Metaspace: 3350K->3350K(1056768K)], 0.0104608 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]

    Exception in thread "main" created byte[]: 16

    0.361: [Full GC (Allocation Failure) 0.361: [Tenured: 143360K->143360K(153600K), 0.0028089 secs] 165153K->164556K(194560K), [Metaspace: 3350K->3350K(1056768K)], 0.0028543 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

    0.364: [Full GC (Allocation Failure) 0.364: [Tenured: 143360K->143360K(153600K), 0.0050038 secs] 164556K->164538K(194560K), [Metaspace: 3350K->3350K(1056768K)], 0.0050390 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

    Disconnected from the target VM, address: '127.0.0.1:57881', transport: 'socket'

    java.lang.OutOfMemoryError: Java heap space

    Heap

        at com.example.demo.gcdemo.SerialGCDemo.main(SerialGCDemo.java:28)

    def new generation  total 40960K, used 22281K [0x00000000f3800000, 0x00000000f6a00000, 0x00000000f6a00000)

      eden space 30720K,  72% used [0x00000000f3800000, 0x00000000f4dc27c0, 0x00000000f5600000)

      from space 10240K,  0% used [0x00000000f6000000, 0x00000000f6000000, 0x00000000f6a00000)

      to  space 10240K,  0% used [0x00000000f5600000, 0x00000000f5600000, 0x00000000f6000000)

    tenured generation  total 153600K, used 143360K [0x00000000f6a00000, 0x0000000100000000, 0x0000000100000000)

      the space 153600K,  93% used [0x00000000f6a00000, 0x00000000ff6000e0, 0x00000000ff600200, 0x0000000100000000)

    Metaspace      used 3381K, capacity 4568K, committed 4864K, reserved 1056768K

      class space    used 364K, capacity 392K, committed 512K, reserved 1048576K

    日志说明:

    0.236: [GC (Allocation Failure) 0.236: [DefNew: 24807K->870K(40960K), 0.0132148 secs] 24807K->21350K(194560K), 0.0132618 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]

    0.236:GC发生的时间(秒),从程序启动开始计算

    [GC:GC类型,另外还有Full GC,GC不会造成STW,Full GC会。

    (Allocation Failure):GC原因,申请内存失败

    [DefNew:说明新生代用Serail GC回收,即default new generation之意。

    24087K -> 870K(40960K):GC前该区域内存已使用容量 -> GC后该区域内存已使用容量(该区域内存总容量)

    0.0132148 secs:该内存区域GC所占用的时间(秒)

    24807K->21350K(194560K):GC前堆内存已使用容量 -> GC后堆内存已使用容量(堆内存总容量:190M,这里要减去from或to的10M)

    0.0132618 secs:本次回收整体占用时间(秒)

    [Times: user=0.02 sys=0.00, real=0.01 secs]:占用时间具体数据。user:用户态消耗的CPU时间,sys:内核态消耗的CPU时间,real:从操作开始到操作结束所经历的墙钟时间。

    0.361: [Full GC (Allocation Failure) 0.361: [Tenured: 143360K->143360K(153600K), 0.0028089 secs] 165153K->164556K(194560K), [Metaspace: 3350K->3350K(1056768K)], 0.0028543 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

    这里只说明一下与上面有区别的地方

    [Full GC:GC类型,会造成STW

    [Tenured:老年代回收

    143360K->143360K(153600K):老年代GC前已使用内存容量 -> 老年代GC后已使用内存容量(老年代总容量)

    165153K->164556K(194560K):堆内存GC前已使用内存容量 -> 堆内存GC后已使用内存容量(堆内存总容量)

    Metaspace:元数据区内存回收情况

    下面分步骤详细看一下从程序开始到结束,对内存的变化过程

    整个内存初始状态如下:

    created byte[]: 0

    created byte[]: 1

    0.236: [GC (Allocation Failure) 0.236: [DefNew: 24807K->870K(40960K), 0.0132148 secs] 24807K->21350K(194560K), 0.0132618 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]

    创建了两个10M的对象(记为ID:0,ID:1),并且没有设置成可回收对象,由于Eden区目前最起码还有一个Random对象,所以在给第三个对象申请内存时,发现Eden区内存不足,触发了GC。

    新生代在GC后变为870K,说明Random对象被复制到from区,而两个10M的对象都直接晋升到了老年代。

    created byte[]: 2

    created byte[] and set to null: 3

    0.252: [GC (Allocation Failure) 0.252: [DefNew: 21941K->717K(40960K), 0.0060942 secs] 42421K->31437K(194560K), 0.0061231 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

    创建了ID:2和ID:3对象,并把ID:3设置为可回收对象

    GC会将Eden区的对象和from区的对象尝试复制到to区,ID:3对象直接回收(通过堆空间的容量变化可以看出:42421K->31437K),ID:2对象在to区中放不下,晋升老年代

    一直到创建ID:12,ID:13,都与上述过程类似,并且没有产生过垃圾对象,但创建完ID:13对象后,老年代的已使用内存达到了130M+,如下:

    created byte[]: 12

    created byte[]: 13

    0.328: [GC (Allocation Failure) 0.328: [DefNew: 21792K->717K(40960K), 0.0162437 secs] 134432K->133837K(194560K), 0.0162844 secs] [Times: user=0.00 sys=0.01, real=0.02 secs]

    再创建ID:14,ID:15对象后,又需要新生代GC

    created byte[]: 14

    created byte[]: 15

    0.347: [GC (Allocation Failure) 0.347: [DefNew: 21793K->21793K(40960K), 0.0000201 secs]0.347: [Tenured: 133120K->143360K(153600K), 0.0103885 secs] 154913K->154316K(194560K), [Metaspace: 3350K->3350K(1056768K)], 0.0104608 secs] [Times: user=0.02 sys=0.00, real=0.01 secs]

    GC前如下所示

    在新生代GC时,要把ID:14,ID:15的对象复制到老年代,但此时老年代已经不足以容纳这两个对象,此时会触发老年代的GC。

    即日志中的Tenured部分。但发现没有任何对象可以回收,然后尝试复制了Eden区的一个对象到老年代

    然后继续创建对象,会继续尝试Full GC,Full GC无果,最终发生内存溢出。

    Exception in thread "main" created byte[]: 16

    0.361: [Full GC (Allocation Failure) 0.361: [Tenured: 143360K->143360K(153600K), 0.0028089 secs] 165153K->164556K(194560K), [Metaspace: 3350K->3350K(1056768K)], 0.0028543 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

    0.364: [Full GC (Allocation Failure) 0.364: [Tenured: 143360K->143360K(153600K), 0.0050038 secs] 164556K->164538K(194560K), [Metaspace: 3350K->3350K(1056768K)], 0.0050390 secs] [Times: user=0.00 sys=0.00, real=0.00 secs]

    Disconnected from the target VM, address: '127.0.0.1:57881', transport: 'socket'

    java.lang.OutOfMemoryError: Java heap space

    Heap

        at com.example.demo.gcdemo.SerialGCDemo.main(SerialGCDemo.java:28)

    4 总结

    首先介绍了Serial的特点以及存在的问题,SerialGC是串行收集器,在收集时会产生STW,停顿时间较长导致用户体验差。

    然后通过实战,介绍了如何指定JVM的每一块堆内存。

    最后通过一个案例,详细描述了SerialGC的整个过程以及内存变化。

    说到最后给大家免费分享一波福利吧!我自己收集了一些Java资料,里面就包涵了一些BAT面试资料,以及一些 Java 高并发、分布式、微服务、高性能、源码分析、JVM等技术资料

    感兴趣的请加Java群:171662117,可以免费来群里下载Java资料

    对Java技术,架构技术感兴趣的同学,欢迎加群,一起学习,相互讨论。

    相关文章

      网友评论

          本文标题:一文吃透JVM分代回收机制(以SerialGC为例)

          本文链接:https://www.haomeiwen.com/subject/yfmcmqtx.html