美文网首页
JVM-对象什么时候进入老年代(实战篇)

JVM-对象什么时候进入老年代(实战篇)

作者: 别拿爱情当饭吃 | 来源:发表于2021-04-19 14:36 被阅读0次

    哈喽哈喽大家猴,我是把代码写成bug的大头菜。公众号:大头菜技术(bigheadit)。原创不易,但欢迎转载。

    上一篇文章:JVM-动态年龄介绍了对象进入老年代的四种方式

    • 大对象
    • 动态年龄判断
    • minor gc后,survivor区空间不能容纳全部存活对象
    • 存活对象达到年龄阈值。比如15

    接下来,我们将用代码方式来验证这四种方式。

    知识回顾

    在实战开始之前,我们先复习一下知识点:

    0.134: [GC (Allocation Failure) 0.134: [ParNew: 7444K->685K(9216K), 0.0011650 secs] 
    7444K->685K(19456K), 0.0012583 secs] [Times: user=0.00 sys=0.00, real=0.01 secs] 
    

    因为涉及到GC日志的查看,我就简单介绍一下日志的大概含义:

    • 0.134。含义就是在程序启动后多久,发生了垃圾回收。单位:秒
    • GC (Allocation Failure)。GC就是发生了垃圾回收的意思,这个不用说都清楚。然后括号里面的Allocation Failure,就是发生垃圾回收的原因。这里Allocation Failure,就是空间分配失败导致发生的垃圾回收。
    • [ParNew:ParNew就是新生代垃圾回收使用的垃圾收集器,同时也代表发生了minor gc。
    • 7444K->685K(9216K), 0.0011650 secs]。接着7444K,是新生代垃圾回收前已使用的空间。685K,是新生代垃圾回收后已使用的空间。9216K,是新生代的总空间。0.0011650 secs,就是垃圾回收需要耗费的时间。
    • 7444K->685K(19456K), 0.0012583 secs],7444K是整个堆(新生代+老年代)垃圾回收前已使用的空间。685K是整个堆垃圾回收后已使用的空间。19456K是整个堆的总空间。
    • [Times: user=0.00 sys=0.00, real=0.01 secs] 。就是本次GC消耗的时间,因为这里保持了2为小数,四舍五入嘛,因此都是0。

    好了,差不多了,直接开始吧!!!!

    大对象

    首先,我们简单回顾一下。


    image

    书本,也没说明,多大的对象才是大对象,比较抽象。

    我们这里直接具体点:

    -XX:PretenureSizeThreshold=3m

    大于等于3m的对象,就是大对象。

    -XX:NewSize=10m -XX:MaxNewSize=10m -XX:InitialHeapSize=20m

    这里,我们给新生代10m,堆20m。

    也就是说,老年代的空间=20m-10m=10m

    -XX:SurvivorRatio=8

    eden:s0:s1等于8:1:1

    所以eden区为8m,s0为1m,s1为1m

    使用的垃圾收集器为ParNew和CMS

    -XX:+UseParNewGC -XX:+UseConcMarkSweepGC

    打印GC的详细信息

    -XX:+PrintGCDetails

    打印GC的时间戳

    -XX:+PrintGCTimeStamps

    那这些GC日志输出在哪里,当然是文件啦。

    -Xloggc:bigobject.log

    好了,JVM的配置差不多了,直接上代码。

    JVM配置参数

    -XX:NewSize=10m -XX:MaxNewSize=10m -XX:InitialHeapSize=20m -XX:MaxHeapSize=20m -XX:SurvivorRatio=8 -XX:PretenureSizeThreshold=3m -XX:MaxTenuringThreshold=15 -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:bigobject.log
    

    代码:


    image

    byte[] array1 = new byte[2_1MB];
    byte[] array2 = new byte[3
    _1MB];

    因为2m的对象不是大对象,因此分配到eden区。而3m的对象是大对象,因此分配到old区。


    image

    上面,这些都是我们根据理论来推测出来的。

    接下来,我们运行一下代码,然后查询日志文件bigobject.log

    Java HotSpot(TM) 64-Bit Server VM (25.261-b12) for bsd-amd64 JRE (1.8.0_261-b12), built on Jun 18 2020 06:38:55 by "java_re" with gcc 4.2.1 Compatible Apple LLVM 10.0.0 (clang-1000.11.45.5)
    Memory: 4k page, physical 33554432k(382392k free)
    
    /proc/meminfo:
    
    CommandLine flags: -XX:InitialHeapSize=20971520 -XX:MaxHeapSize=20971520 -XX:MaxNewSize=10485760 -XX:MaxTenuringThreshold=15 -XX:NewSize=10485760 -XX:OldPLABSize=16 -XX:PretenureSizeThreshold=3145728 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:SurvivorRatio=8 -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseConcMarkSweepGC -XX:+UseParNewGC 
    Heap
     par new generation   total 9216K, used 4849K [0x00000007bec00000, 0x00000007bf600000, 0x00000007bf600000)
      eden space 8192K,  59% used [0x00000007bec00000, 0x00000007bf0bc580, 0x00000007bf400000)
      from space 1024K,   0% used [0x00000007bf400000, 0x00000007bf400000, 0x00000007bf500000)
      to   space 1024K,   0% used [0x00000007bf500000, 0x00000007bf500000, 0x00000007bf600000)
     concurrent mark-sweep generation total 10240K, used 3072K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
     Metaspace       used 3074K, capacity 4496K, committed 4864K, reserved 1056768K
      class space    used 337K, capacity 388K, committed 512K, reserved 1048576K
    

    现在,我们分析一下日志内容,来验证我们的猜测是否正确。

    CommandLine flags: -XX:InitialHeapSize=20971520 -XX:MaxHeapSize=20971520 -XX:MaxNewSize=10485760 -XX:MaxTenuringThreshold=15 -XX:NewSize=10485760 -XX:OldPLABSize=16 -XX:PretenureSizeThreshold=3145728 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:SurvivorRatio=8 -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseConcMarkSweepGC -XX:+UseParNewGC
    Heap

    上面这一堆,就是我们自己设置的JVM参数,也有一些系统帮我们添加的。比如:-XX:+UseCompressedClassPointers -XX:+UseCompressedOops

    这些不是重点,你了解一下就好。

    重点是这个:

    Heap  
     par new generation   total 9216K, used 4849K [0x00000007bec00000, 0x00000007bf600000, 0x00000007bf600000)
      eden space 8192K,  59% used [0x00000007bec00000, 0x00000007bf0bc580, 0x00000007bf400000)
      from space 1024K,   0% used [0x00000007bf400000, 0x00000007bf400000, 0x00000007bf500000)
      to   space 1024K,   0% used [0x00000007bf500000, 0x00000007bf500000, 0x00000007bf600000)
     concurrent mark-sweep generation total 10240K, used 3072K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
    

    代表的含义是:GC后堆的情况,注意是GC后。这里特别强调一下。

    par new generation total 9216K, used 4849K
    代表的新生代,现在总的空间大小是9216K,已使用的空间大小是4849K。

    其实我们知道,有2M对象是进入了eden区的,但是现在4849K明显是大于2048K(2M)的。

    那说明了什么?

    说明,其实JVM除了加载我们自己写的对象外,还会加载一些其他未知对象。未知对象,主要由JVM本身产生,这部分大家先忽略就好

    回到主要问题上:大对象是否会直接进入老年代。

    我们看以下这段日志:

    concurrent mark-sweep generation total 10240K, used 3072K

    老年代的总空间大小是10240K,目前已经使用了3072K。

    看到这里,其实相信大家已经可以明白了。我们把大对象定义为大于等于3m的对象。而日志也告诉我们,目前老年代已经被占用了3072K,即3m。

    因此,到这里我们已经用代码验证了:大对象会直接进入老年代。

    动态年龄判断

    首先,我们还是先了解一下什么是动态年龄判断?

    书本的解释如下:


    image

    总结一下:就是说survivor区中,如果相同年龄的所有对象大小所占用的空间大于survivor空间的一半,年龄大于或等于该年龄对象的,都可以直接进入老年代。

    这是书本的说法。。

    但其实这个说法是错误的。

    相信看过我另一篇JVM-动态年龄的小伙伴,是了解正确的说法应该是:在survivor区中,所有年龄的对象的所占空间的累加和大于survivor空间的一半,大于或等于该年龄的对象,都可以进入老年代。

    接下来我们直接上代码和JVM配置参数:

    JVM配置参数:

    -XX:NewSize=10m -XX:MaxNewSize=10m -XX:InitialHeapSize=20m -XX:MaxHeapSize=20m -XX:SurvivorRatio=8 -XX:PretenureSizeThreshold=10m -XX:MaxTenuringThreshold=15 -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -Xloggc:dynamicheck.log
    

    代码:


    image

    我们先直接把代码跑起来,然后直接看日志文件:

    Java HotSpot(TM) 64-Bit Server VM (25.281-b09) for bsd-amd64 JRE (1.8.0_281-b09), built on Dec  9 2020 12:44:49 by "java_re" with gcc 4.2.1 Compatible Apple LLVM 10.0.0 (clang-1000.11.45.5)
    Memory: 4k page, physical 16777216k(106332k free)
    
    /proc/meminfo:
    
    CommandLine flags: -XX:InitialHeapSize=20971520 -XX:MaxHeapSize=20971520 -XX:MaxNewSize=10485760 -XX:MaxTenuringThreshold=15 -XX:NewSize=10485760 -XX:OldPLABSize=16 -XX:PretenureSizeThreshold=10485760 -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:SurvivorRatio=8 -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseConcMarkSweepGC -XX:+UseParNewGC 
    
    0.117: [GC (Allocation Failure) 0.118: [ParNew: 7115K->619K(9216K), 0.0029447 secs] 7115K->619K(19456K), 0.0033789 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
    0.122: [GC (Allocation Failure) 0.122: [ParNew: 7223K->0K(9216K), 0.0020215 secs] 7223K->601K(19456K), 0.0020509 secs] [Times: user=0.01 sys=0.00, real=0.00 secs] 
    Heap
     par new generation   total 9216K, used 2212K [0x00000007bec00000, 0x00000007bf600000, 0x00000007bf600000)
      eden space 8192K,  27% used [0x00000007bec00000, 0x00000007bee290e0, 0x00000007bf400000)
      from space 1024K,   0% used [0x00000007bf400000, 0x00000007bf400000, 0x00000007bf500000)
      to   space 1024K,   0% used [0x00000007bf500000, 0x00000007bf500000, 0x00000007bf600000)
     concurrent mark-sweep generation total 10240K, used 601K [0x00000007bf600000, 0x00000007c0000000, 0x00000007c0000000)
     Metaspace       used 2713K, capacity 4486K, committed 4864K, reserved 1056768K
      class space    used 291K, capacity 386K, committed 512K, reserved 1048576K
    
    

    部分代码剖析:


    image

    现在连续分配了3个2M的对象,和1个300K的对象,最后还把array1置为null。此时的堆图应该是这样子的

    image

    接下来,还要继续分配一个2M的对象,这个时候eden区还能继续分配空间吗?

    肯定不可以,因为eden区只有8M。

    image

    那这个时候,只好执行young gc来清理空间了。

    接着,我们看一下日志文件:

    ParNew: 7115K->619K(9216K)

    说明GG前,占用了7115K,这里大概包括3个2m对象+300k对象+几百K未知对象。经过GC后,只剩下619K对象,包括300K对象和未知对象。

    然后给新创建的2m对象分配到eden区

    image

    此时,我们得观察一个重点:就是from区是1m,就是1024K。现在呢,有619K对象已经来到了from区,是超过from区的一半的。

    接着我们继续看代码:

    image

    执行完这个代码。会在堆里会新增2个2m对象,1个300K对象,最后array3置为null。

    如果要继续执行byte[] array4 = new byte[2*_1MB];

    那么eden区就不够空间了。这个时候会触发第二次young gc了。

    我们继续看一下第二次young gc的日志:

    ParNew: 7223K->0K(9216K)

    说明了啥?

    GC前,一共使用了7223K,包括eden区的3个2m对象+300K对象和from区的300K对象+未知对象,GC后,整个新生代都有空了。


    image

    理论上,GC后,array2还引用着300K对象的。所以,可以肯定的是,这300K对象,肯定不会被回收。

    但现在GC日志明显告诉我们,新生代在GC后的空间使用率为0。

    这是为什么呢?

    不着急,我们继续看一下老年代的空间日志:

    concurrent mark-sweep generation total 10240K, used 601K

    你看,老年代竟然被使用了601K。其实这601K,就是300K对象和未知对象的空间。

    为什么它们会在老年代?

    就是因为触发了动态年龄判断呀。

    你想想,首先,300K不是大对象吧。(-XX:PretenureSizeThreshold=10m)

    也没到达15岁,因为才young gc两次。(-XX:MaxTenuringThreshold=15)

    而且现在survivor是1024K空间,是足以容纳601K的存活对象的。所以,这些都不是导致对象进入老年代的原因。

    现在因为2次young gc,那600K对象都存活着,并且占用的空间是超过survivor区的空间大小一半。从而触发动态空间判断,进入老年代。

    说到这里,相信大家应该都能明白了。如果还不明白,欢迎加大头菜微信一起探讨。

    纸上得来终觉浅,剩下的2种情况:

    • minor gc后,survivor区空间不能容纳全部存活对象
    • 存活对象达到年龄阈值。比如15

    这两种情况的代码,你们可以自己试试实战一下。

    留一个问题给大家思考一下,欢迎大家留言交流:

    survivor空间不足以容纳存活对象时,是不是所有对象都会进入老年代?还是会有部分进入老年代,剩下部分留在survivor区?

    我呢,代码已经写好了。大家自行在后台获取即可。

    在公众号回复:jvm代码。可以查看这四种情况的实战代码。

    絮叨

    本来这种涉及到代码实战的技术分享,应该录视频讲比较好的。

    但是实在太难了。大头菜自认为是一个脸皮厚的人,但是昨晚录了3个小时,都没录完。

    要么就是中途结巴,要么就是中途紧张,总之,害,写文章和录视频,真的两回事。写文章上,我思路算是比较清晰的。但录视频真的紧脏呜呜呜。。。。。。

    我忍不住想吐槽一下自己的声音,录完后,我听了一下自己的声音。

    咦惹。。。妈呀。。。。。什么鬼。。辣耳朵

    果然,听自己的声音是需要勇气的。。。。。

    但,我还是会继续尝试录视频的,剪完后,给大家分享。

    相关文章

      网友评论

          本文标题:JVM-对象什么时候进入老年代(实战篇)

          本文链接:https://www.haomeiwen.com/subject/pbpilltx.html