美文网首页
JVM的七种垃圾收集器

JVM的七种垃圾收集器

作者: 星空怎样 | 来源:发表于2020-05-28 17:55 被阅读0次

[toc]

前言

如果说收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现。Java虚拟机规范中对垃圾收集器应该如何实现并没有任何规定,因此不同厂商、版本的虚拟机所提供的垃圾收集器都可能会有很大的差别,并且一般都会提供参数供用户根据自己的应用特点和要求组合各个年代所使用的收集器。接下来讨论的收集器基于JDK1.7 Update 14 之后的HotSpot虚拟机(在版本中正式提供了商用的G1收集器,之前G1仍处于实验状态),该虚拟机包含如下图所示:


image

上图展示7中年作用域不同分代的收集器,如果两个收集器之间存在连线,就说明可以搭配使用。虚拟机所处区域,则表示属于兴盛带还是老年代收集器。HotSpot实现了如此多的收集器,正式因为目前并无完美的收集器出现,只是选择对具体应用最适合的收集器

一、相关概念:

并行和并发

  • 并行:指多条垃圾收集线程并行工作,但此时用户线程仍处于等待状态
  • 并发:指用户线程与垃圾回收线程同时执行(但不一定并行,可能会交替执行),用户线程在继续进行,而垃圾收集在另一个CPU上。

吞吐量

吞吐量就是CPU用于运行用户代码的时间与CPU时间的比值,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾回收时间)
假设虚拟机总运行100分钟,其中垃圾回收使用了1分钟,那么吞吐量就是99%

Minor GC 和 Full GC

  • 新生代GC (Minor GC):指发生在新生代的垃圾收集收集动作,因为Java对象大多具备朝生夕死的特性,所以Minor GC非常频繁,一般回收速度也比较快
  • 老年代GC(Major GC/Full GC):指发生在老年代的GC,出现了Major GC,经常伴随至少一次的Minor GC(但非绝对的,在Parallel Scavenge收集器的收集策略就有直接进行Major GC的策略过程)。Major GC的速度一般会比Minor GC慢10倍

二、新生代收集器

Serial收集器

Serial(串行)收集是最基本的,采用
复制算法新生代收集器,曾经(JDK1.3.1之前)是虚拟机新生代的唯一选择。他是一个单线程收集器,只会使用一个CPU或一条收集线程取完成垃圾收集工作,更重要的是他在进行垃圾收集时,必须暂停其他所有的工作线程,直至Serial收集器收集结束为止("Stop The Word")。这项工作是由虚拟机在后台自动发起和自动完成的,在用户不可见的情况下把用户正常工作的线程全部停掉,这对很多应用来说都是难以接受的。
下面是展示Serial收集器(老年代采用的Serial Old收集器)的运行过程

image
为了消除或减少工作线程因内存回收而导致的停顿,HotSpot虚拟机开发团队在JDK1.3之后的Java发展历程中研发了各种其他优秀的收集器,这些稍后介绍,但是这些收集器的诞生并不意味着Serial收集器"老而无用",实际上到现在为止他依然是HotSpot虚拟机运行在Client模式下的默认的新生代收集器。他也有着由于其他收集器的地方:简单而高效(与其他收集器的单线程相比),对于限定单个CPU的环境来说,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得更高的单线程收集效率。
在用户桌面应用场景中,分配给虚拟机管理的内存一般不会太大,收集几十兆甚至一两百兆的新生代(仅仅是新生代使用的内存,桌面应用基本不会再大了),停顿的时间完全可以控制在几十毫秒最多一百毫秒以内,只要不频繁发生,这点停顿时间是可以接受的,所以Serial收集器对于运行在Client模式下的虚拟机来说是一个很好的选择。

ParNew收集器

ParNew收集器就是在Serial收集器的多线程版本,他也是一个新生代收集器。除了使用了多线程进行垃圾收集外,其余行为包括Serial收集器可用的所用控制参数、收集算法(复制算法)、Stop The World、对象分配规则、回收策略等于Serial收集器完全相同,两者共用了相当多的代码。
PerNew收集器的工作过程如下图(老年代采用的Serial Old)

image
ParNew收集器除了使用了多线程收集以外,其他的与Serial收集器相比并无太多创新之处,但他确实许多运行在Server模式下的虚拟机中首选的新生代收集器,其中有一个与性能无关的重要原因是除了,Serial收集器以外目前只有他能和CMS收集器(Concurrent Mark Sweep)配合工作CMS收集器是JDK1.5推出的一个具有划时代意义的收集器,具体内容将在稍后进行介绍。
ParNew收集器在单CPU环境中绝对不会有比Serial收集器有更好的效果,甚至由于存在线程的交互的开销,在收集器在通过超线程技术实现的两个CPU的环境中都不能百分百保证可以超越。在多CPU环境下,随着CPU的数量增加,他对于GC是系统资源的有效利用是很有好处的,他默认开启收集线程与CPU的数量相同,在CPU非常多的情况下可以使用-XX:ParallegGCThreads参数设置

Parallel Scavenge收集器

Parallel Scavenge收集器也是一个并行的多线程新手代收集器,使用的也是复制算法。Parallel Scavenge收集器的特点是关注点与其他收集器不同,CMS等收集器的关注点是尽可能缩短垃圾收集时用户线程的停顿时间,而Parallel Scavenge收集器的目标是达到一个可控制的吞吐量(Throughput)
停顿时间越短就越适合需要与用户交互程序,良好的响应速度能提升用户体验。而高吞吐量则可以高效率的利用CPU时间。尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务
Parallel Scavenge收集器除了会显而易见的提供可以精确控制吞吐量的参数,还提供了一个参数 -XX:+UseAdaptiveSizePolicy,这是一个开关参数,打开参数后,就不需要手工指定新生代的大小(-Xmm)、Eden和Survivor区的比例(-XX:SurvivorRatio)、晋升老年代的年龄(-XX:PretenureSizeThreshold)等细节参数了,虚拟机会根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或者最大的吞吐量,这种方式成为GC自适应的调节策略(GC Ergonomics)。自适应调节策略也是Parallel Scavenge收集器与ParNew收集器的一个重要区别。
例外值得注意的一点事,Parallel Scavenge收集器无法与CMS收集器配合使用,所以在JDK1.6推出Parallel Old之前,如果新生代选择Parallel Scavenge收集器,老年代只有Serial Old收集器能与之配合使用
以下Parallel Scavenge/Parallel Old收集器配合使用的流程图

image

三、老年代收集器

Serial Old收集器

Serial Old是Serial收集器的老年代版本,同样是一个单线程收集器,使用标记-整理(Mark-Compact)算法。
此收集器的主要意义也是在于给Client模式下的虚拟机使用,如果在Server模式下,他还有两个用途:

  • 在Jdk 1.5以及之前版本(Parallel Old诞生之前)中与Parallel Scavenge收集器搭配使用。
  • 作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure时使用。
    他的工作流程与Serial收集器相同,这里在给出Serial/Serial Old配合使用的工作流程图:
    image

Parallel Old收集器

Parallel Old收集器是Parallel Scavenge收集器的老年代版本,使用多线程和标记-整理算法。前面已经提到过,这个收集器是在JDK1.6中才开始提供的,在此之前,如果新生代选择了Parallel Scavenge收集器,老年代除了Seerial Old以为别无选择,所以在Parallel Old诞生之后。吞吐量优先收集器终于有了比较名副其实的应用组合,在注重吞吐量以及CPU资源敏感的场合,都可以优先考虑Parallel Scavenge加Parallel Old收集器,Prallel Old收集器的工作流程与Parallel Scavenge相同,这里给出Parallel Scavenge/Parallel Old收集器配合使用的流程图:

image

CMS收集器

CMS(Concurrent Mark Sweep)收集器是一种以获得最短回收停顿时间为目标的收集器,他非常符合那些集中在互联网或者B/S系统的服务端上的java应用,这些应用都非常重视服务的响应速度。从名字上("Mark Sweep")就可以看出他是基于标记-清楚算法实现的
CMS收集器工作的整个过程分为以下四个步骤:

  • 初始标记(CMS initial mark):仅仅只是标记一下GC Roots能直接关联到的对象,速度很快需要Stop The Word
  • 并发标记(CMS coneurrent mark):进行GC Roots Tracing的过程,在整个过程中耗时最长。
  • 重新标记(CMS remark):为了修正并发标记期间因为用户程序继续执行而导致标记产生了变动的那一部分对象的标记记录,这个阶段的停顿时间一般会比初始化标记阶段稍长一些,但远比并发标记时间短,此阶段也需要Stop The Word
  • 并发清除(CMS concurrent sweep)
    由于整个过程中耗时最长的并发标记和并发清除过程收集器线程都可以与用户线程一起工作,所以,从总体上来说,CMS收集器的内存回收过程是与用户线程一起并发执行的,通过下图可以比较清楚的看到CMS收集器运作的步骤中并发和需要停顿的时间:
    image

优点

CMS是一款优秀的收集器,它主要优点在名字上提现了:并发收集、低停顿,因此CMS收集器也被称为并发低停顿收集器(Concurrent Low Pause Collector)

缺点

  • 对CPU资源敏感其实,面向并发设计的程序都对CPU资源敏感。并发阶段,它虽然不会导致用户线程停顿,但会因为占用了一部分线程(或者CPU资源)而导致应用程序变慢,总吞吐量会降低。CMS默认启动的回收线程时(CPU数量+3)/4也就是当CPU在4个以上时,并发回收时垃圾线程不少于25%的CPU资源,并且随着CPU数量增加而下降。但是当CPU不足4个时(比如2个),CMS对用户线程的影响就会变的很大,如果本来CPU负载就比较大,还要分一半的运算能力去执行收集线程,就可能导致执行速度忽然降低了50%,其实让人无法接受
  • 无法处理浮动垃圾(Floating Garbage)可能会出现Concurrent Mode Failure失败而导致另一次Full GC 的产生,由于CMS并发清理阶段用户线程还在运行着,伴随程序运行自然就还会有新的垃圾不断产生。这部分垃圾出现在标记过程之后,CMS无法在当次收集中处理掉他们,只好留待下一次GC时在清理掉。这一部分垃圾就是“浮动垃圾”。也是由于在垃圾收集阶段用户线程还需要运行,那也就还需要预留有足够的内存空间给用户线程使用,因此CMS收集器不能像其他收集器那样等到老年代几乎完全被填满了在进行收集,需要预留一部分空间提供并发收集是的程序运作使用。
  • 标记-清除算法导致空间碎片CMS是一款基于“标记-清除”算法实现的收集器,这意味着收集结束会有大量的空间碎片。空间碎片过多时,将会给大对象分配带来很大的麻烦,往往出现老年代剩余,但无法找到最够大连续空间来分配当前对象

G1收集器

G1(Garbage-First)收集器是当今收集器技术最前沿的成果之一,他是基于一款面向服务端应用的垃圾收集器,HotSpot开发团队赋予他的使命是(比较长期的)未来可以替换掉JDK1.5发布的CMS收集器。与其他收集器相比,G1具备如下特点:

  • 并行并发G1能充分利用多CPU、多核环境下的硬件优势,使用多个CPU来缩短“Stop The Word”停顿时间,本分其他收集器需要停顿java线程执行GC动作,G1收集器仍然可以通过并发的方式让JAVA程序继续执行。
  • 分代收集以其他收集器一样,分代概念在G1中依然得以保留。虽然可以不需要其他的垃圾收集器配合就能独立管理GC堆,但它能够采用不同的方式处理新创建的对象和已存活一段时间、熬过多次GC的就对象来获取更好的收集效果
  • 空间整合G1整体来看是基于标记-整理算法实现的收集器,从局部(两个Region之间)上来看是基于复制算法实现的,这意味着G1运行期间不会产生内存碎片,收集后能够提供整的可用内存,此特性有利于程序长时间运行,分配大对象时不会因为找不到连续内存空间而提前触发下一次GC
  • 可预测的停顿这是G1相对CMS的一大优势,降低停顿时间是G1和CMS共同的关注点,但G1除了降低停顿外,还能建立可预测停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在GC上时间不得超过N毫秒,这几乎已经是实时Java的垃圾收集器特征了。

横跨整个堆内存

在G1之前的其他收集器进行收集的范围都是整个新生代或者老年代,而G1不在这样。G1使用是Java堆内存布局与其他收集器很大的区别,他将整个java堆划分为多个大小相等的独立区域(Region),虽然还保留新生代和老年代的概念,但新生代和老年代不在是物理隔离的了,而都是一部分Region(不需要连续)的集合

建立可预测的时间模型

G1收集器之所以能建立可预测的停顿模型,是因为他可以有计划地避免整个Java堆进行全区域的垃圾收集G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获得空间大小以及回收所需要的经验),在后台维护一个优先列表,每次根据运行的收集时间,优先回收价值最大的Region(这也就是Garbage-First名称的来由)。这种使用Region划分内存空间及有优先级区域回收的方式,保证了G1收集器在有限的时间内可以获取尽可能高的收集效率。

避免全堆扫描---Remembered Set(记忆集)

G1把java堆分为多个Region,就是化整为零。但是Region不可能是孤立的,一个对象分配在某个Region中,可以与整个Java堆任意的对象发生引用关系。在做可达性分析对象是否存活时候,需要扫描整个Java堆才能保证准确性,这显然是对GC效率的的极大伤害。
为了避免全堆扫描的发生,虚拟机为G1中每个Region维护一个与之相对的应的Remembered Set。虚拟机发现程序在对Reference类型的数据进行写操作时,会产生一个Write Barrier(写屏障)暂时中断写操作,检查Reference引用的对象是否处于不同的Region之中(在分代的例子中就是检查是否老年代中的对象引用了新生代对象),如果是便通过CardTable把相关引用信息记录到被引用的对象所属的Region的Remembered Set中。当进行内存回收时,在GC根节点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。
如果不计算维护Remembered Set操作,G1收集器的运作大致分为以下步骤:

  • 初始标记(Initial Marking)仅仅只是标记一下GC Roots能直接关联找到的对象,并且修改TAMS(Nest Top Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可以的Region中创建对象,此阶段需要停顿线程,但耗时很短。
  • 并发标记(Concurrent Marking):从GC Root开始对堆中对象进行可达性分析,找到存活对象,此阶段好使较长,但可以用户线程并发执行
  • 最终标记(Final Marking):为了修正在并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录,虚拟机在这段时间对象变化记录在线程的Remembered Set Logs里面,最终标记阶段需要把Remembered Set Logs的数据合并到Remembered Set中,这阶段需要停顿线程但是可并行执行。
  • 筛选回收(Live Data Counting and Evacuation):首先对各个Region中回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划,此阶段其实也可做到与用户程序一起并发执行,但是因为只回收一部分Region,时间是用户可控制的,而且停顿用户线程将大幅度提高收集效率。

通过下图可以比较清除的看到G1收集器的运作步骤中并发和需要停顿的阶段(Safe point处):


image

总结

收集器 串行、并行or并发 新生代/老年代 算法 目标 使用场景
Serial 串行 新生代 复制算法 响应速度优先 单CPU环境下的Client模式
Serial Old 串行 老年代 标记-整理 响应速度优先 单CPU环境下的Client模式、CMS的后备预案
ParNew 并行 新生代 复制算法 响应速度优先 多CPU环境是Server模式下与CMS配合
Parallel Scavenge 并行 新生代 复制算法 吞吐量优先 在后台运算而不需要太多交互的任务
Parallel Old 并行 老年代 标记整理 吞吐量优先 在后台运算而不需要太多交互的任务
CMS 并发 老年代 标记-清楚 响应速度优先 集中在互联网站或B/S系统服务端上的java应用
G1 并发 全部 标记-整理+复制算法 响应速度优先 面向服务端应用,将来替换CMS

相关文章

  • G1收集器详解

    详解 JVM Garbage First(G1) 垃圾收集器 G1垃圾收集器入门

  • 5种JVM垃圾收集器特点和8种JVM内存溢出原因

    先来看看5种JVM垃圾收集器特点 一、常见垃圾收集器 现在常见的垃圾收集器有如下几种: 新生代收集器: Seria...

  • Jvm之CMS垃圾收集器

      这篇文章主要介绍JVM的CMS垃圾收集器,以及JVM提供的垃圾收集算法。 一、垃圾收集算法   JVM提供的三...

  • 2020互联网Java后端面试专题解析—JVM21题

    前言 文章对 JVM 内存区域分布、JVM 内存溢出分析、JVM 垃圾回收算法/垃圾收集器、JVM 性能调优工具及...

  • GC - 收集器

    概述 垃圾收集器是垃圾回收算法的具体实现,不同商家、不同版本的 JVM 所提供的垃圾收集器可能会有差别 收集器组合...

  • JVM垃圾回收

    JVM垃圾收集器 一、垃圾收集器的分类 1.1 Serial GC 出现的最早,比较古老,最大的特点就是垃圾收集策...

  • JVM

    JVM(1):Java 类的加载机制 JVM(2):JVM内存结构 JVM(3):Java GC算法 垃圾收集器 ...

  • JVM源码分析系列

    JVM G1算法系列 G1垃圾收集器介绍 G1垃圾收集器之RSet G1垃圾收集器之SATB G1垃圾收集器之对象...

  • JVM垃圾收集器总结

    通过上篇JVM垃圾回收算法和垃圾收集器我们对JVM的七大垃圾收集器的运行原理有了大致的了解,我们来总结一下他们之间...

  • 05 | JVM-GC收集器

    常见的垃圾收集器 上一篇文章中介绍了JVM的GC常见算法,而JVM的垃圾收集器就是这些算法使用编程语言的具体实现,...

网友评论

      本文标题:JVM的七种垃圾收集器

      本文链接:https://www.haomeiwen.com/subject/nhgaahtx.html