GC总结

作者: 一线游骑兵 | 来源:发表于2019-01-10 19:24 被阅读4次

    原文:为知笔记外链

    对象回收设计两类操作:

    1. 判断对象是否可回收
    2. 执行回收

    判断对象可被回收的算法:

    引用计数法 【效率高,无法解决相互引用问题】

    给对象添加一个引用计数器,每当有地方引用则该计数器值+1,当引用失效则-1;计数器为0的对象不可再被使用,可以被回收。

    可达性分析算法

    通过一系列成为 “GC Root" 的对象作为起点,从这些节点开始向下搜索,搜索所走过的路径为 引用链(MAT中的支配树),当一个对象到 GC Roots 没有任何引用链相连,即GC Roots到这个对象不可达时,则证明此对象不可用。

    可作为GC Roots的对象包括:

    1. 虚拟机栈(栈帧中的本地变量表)中引用的对象。

    2. 方法区中类静态属性引用的对象。

    3. 方法区中常量引用的对象。

    4. 本地方法栈中JNI(Native方法)引用的对象。

    引用:
    1. 强引用:GC永远不会回收掉的被引用的对象【通过 new 创建的对象】

    2. 软引用【SoftReference】:有用但非必须的对象。在系统将要发生内存溢出之前,将会把这些对象列进回收范围中进行第二次回收。如果这次回收还没有足够的内存,才会抛出内存溢出异常。

    3. 弱引用【WeakReference】:非必须的对象。强度比软引用弱,被弱引用关联的对象只能存活到下次垃圾收集发生之前。当垃圾回收时,无论当前内存是否足够,都会回收掉被弱引用关联的对象。

    4. 虚引用【PhantomReference】:无用,唯一目的就是能在被收集器回收时受到一个系统通知。

    即使在可达性分析算法中不可达的对象,也并非是“非死不可”的,这时它们会处于 ”缓刑“ 阶段,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行可达性分析之后发现没有与GC Roots相连接的引用链,那它将被第一次标记并且进行一次 筛选 ,筛选的条件是此对象是否有必要执行 finalize() 方法。【当对象没有覆盖 finalize() 方法,或者 finalize() 方法已被虚拟机调用过,jvm将这两种情况视为 没有必要执行 】。
    如果该对象被判定为有必要执行 finalize() 方法,那么该对象会被放置在一个 F-Queue 的队列中,并在稍后由一个虚拟机自动建立的、低优先级的 Finalizer 线程去执行它。【所谓执行是指jvm会触发该方法,但并不承诺会等待它运行结束,因为如果一个对象在 finalize() 方法中执行缓慢或死循环,将可能导致F-Queue队列中其他对象永久处于等待,甚至导致整个内存回收系统崩溃。】
    finalize() 方法时对象逃脱死亡命运的最后一次机会,稍后GC将对F-Queue中的对象进行第二次小规模标记,如果对象要在finalize()方法中成功拯救自己--只要重新与引用链上的任何一个对象建立关联即可,之后在第二次标记时会被移除“即将回收”的集合。
    如果对象这时还没有逃脱,基本上就真的会被回收了【u are done】。
    任何一个对象的finalize()方法都只会被系统自动调用一次,如果对象面临下一次回收,则该方法不会再被执行。

    垃圾收集算法:【执行回收】

    标记-清除算法
    最基础的收集算法。算法分为 “标记” 和 “清除” 两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。【标记过程如上】。
    标记-清除过程
    存在问题:
    1. 效率不高。标记和清除效率都不高。

    2. 空间问题:标记清除之后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后程序运行过程中需要分配较大对象时,无法找到足够连续内存而不得不提前触发另一次垃圾收集动作。

    复制算法【新生代】
    将可用内存按容量划分为大小相等的两块,每次只使用其中一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上边,然后再把已使用过的内存空间一次清理掉。
    复制算法

    好处:每次对整个半区进行内存回收,不必考虑内存碎片等情况,只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效。

    不足:代价是将内存缩小一半。

    目前主流均采用该收集算法回收新生代【分代收集】。IBM研究表明,新生代中的对象98%都是朝生夕死,所以不必按照1:1的比例来划分内存空间,而是将内存划分为一块儿比较大的 Eden空间和两块较小的Survivor空间,每次使用 Eden 和其中一块Survivor空间。当回收时,将Eden和Survivor中还存活着的对象一次性的复制到另外一块Survivor空间上,最后清理掉Eden和刚刚使用过的Survivor空间。HotSpot虚拟机默认比例是8:1,也就是每次新生代中可用内存空间为整个新生代容量的90%(80%+10%),只有10%的内存会被“浪费”
    内存的分配担保机制:如果另外一块儿Survivor空间没有足够空间存放上次新生代收集下来的存活的对象时,这些对象会通过 分配担保机制 进入老年代。
    标记-整理算法【老年代】

    复制收集算法在对象存活率较高时就要进行较多的复制操作,效率会变很低。如果不想浪费50%的空间,就需要额外的空间进行分配担保,以应对被使用的内存中所有对象都100%存活的极端情况,所以老年代一般不直接选用这种算法

    标记过程与 标记-清除 算法一致,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。示意图如下:
    标记-整理算法

    分代收集算法

    目前商业虚拟机都采用的垃圾收集算法。根据对象存活周期的不同将内存划分为几块。将Java堆分为新生代和老年代。这样就可以根据各个年代的特点采用最适当的收集算法。在新生代中,每次垃圾收集时都会有大批对象死去,只有少量存活,则选用复制算法,只需付出少量存活对象的复制成本即可。而老年代中因为对象存活率高、没有额外空间对它进行分配担保,因此必须使用标记-清理或标记-整理算法进行回收。

    臭名昭著的 STW (Stop the world)

    可达性分析时,必须在一个能确保一致性的快照中进行---即整个分析期间整个执行系统看起来就像被冻结在某个时间点上,不可以出现分析过程中对象引用关系还在不断变化的情况,否则分析结果准确性就无法保证。这点是导致GC进行时必须停顿所有Java执行线程的一个重要原因。即使在号称几乎不会发生停顿的CMS收集器中,枚举根节点时也必须停顿。

    安全点:但程序执行时并非在所有的地方都能停顿下来开始GC,只有到达安全点(SafePoint)才能暂停。让所有线程在GC发生时跑到安全点的方法有:抢先式中断和主动式中断。

    内存分配与回收策略

    • 对象优先在Eden分配。大多数情况下,对象在新生代Eden区中分配。当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC.

    • 大对象直接进入老年代。需要大量连续内存空间的Java对象,如很长的字符串或数组,将被分配到老年代。

    • 长期存活的对象将进入老年代。虚拟机给每个对象定义了一个对象年龄计数器。如果对象在Eden出生并且经过依次Minor GC后仍然存活,并且能被Survivor容纳,将被移动到Survivor空间中,并且对象年龄设为1。对象在Survivor区中每 “熬过” 依次Minor GC,年龄就会+1,当年龄增加到一定程度(默认15,可通过 -XX:MaxTenuringThreshold设置),就会被晋升到老年代中。

    • 如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象可以直接进入老年代,无须等到 MaxTenuringThreshold 中要求的年龄。

    相关文章

      网友评论

          本文标题:GC总结

          本文链接:https://www.haomeiwen.com/subject/yiqzrqtx.html