如果说上一节说的垃圾收集算法是内存回收的方法论,那么垃圾收集器就是内存回收的具体实现
简单的介绍Java的垃圾收集器以及选择它们对应的命令行开关。
常用堆相关开关
Java有很多的不同的命令行开关可以用,这里我们只说一些常用的基础的开关.
命令开关
描述
-Xms
设置JVM启动时候的初始堆的大小
-Xmx
设置最大堆的大小
-Xmn
设置年轻代的大小
-XX:PermSize
设置永久代的起始大小
-XX:MaxPermSize
设置永久代的最大的大小
The Serial GC
Serial GC 是Java SE5 和6中默认设置的,不管是minor gc 还是 major gc 都是依此使用Serial GC(使用单个cpu),除此之外,它们还使用Mark-compact 收集方法,此方法将较旧的内存移动到堆的开头,以便在堆的末尾将新的内存分配放入单个连续的内存块中。内存的压缩使更快地向堆分配新的内存块。
使用案列
对于大多数没有低暂停时间要求并在客户端计算机上运行的应用程序,Serial GC是首选的垃圾收集器。它仅利用单个虚拟处理器进行垃圾收集工作(就像Serial GC这个名字一样)。在当今的硬件上,Serial GC可以有效地管理许多具有数百MB Java堆的应用程序,而且最坏的情况下暂停时间也相对较短(对于完整的垃圾回收,大约需要几秒钟)。
Serial GC的另一种流行用法是在同一台机器上运行大量JVM的环境中(在某些情况下,JVM比可用处理器更多!)。在此类环境中,当JVM进行垃圾回收时,最好使用一个处理器以最大程度地减少对其余JVM的干扰,即使垃圾回收可能持续更长时间也是如此。Serial GC非常适合这种初衷方案。
最后,随着具有最少内存和少量内核的嵌入式硬件的兴起,Serial GC可能卷土重来。
命令行开关
要启用串行收集器,请使用:
-XX:+UseSerialGC
这是用于启动的示例命令行Java2Demo:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseSerialGC -jar c:\javademos\demo\jfc\Java2D\Java2demo.jar
The Parallel GC
Parallel Scavenge收集器类似ParNew收集器,Parallel收集器更关注系统的吞吐量。可以通过参数来打开自适应调节策略,虚拟机会根据当前系统的运行情况收集性能监控信息,动态调整这些参数以提供最合适的停顿时间或最大的吞吐量;也可以通过参数控制GC的时间不大于多少毫秒或者比例;新生代复制算法、老年代标记-压缩
参数控制:-XX:+UseParallelGC 使用Parallel收集器+ 老年代串行
Parallel Old 收集器
Parallel Old是Parallel Scavenge收集器的老年代版本,使用多线程和“标记-整理”算法。这个收集器是在JDK 1.6中才开始提供
参数控制: -XX:+UseParallelOldGC 使用Parallel收集器+ 老年代并行
使用案列
Parallel GC 也称为吞吐量收集器。由于它可以使用多个CPU来加快应用程序吞吐量。当需要完成大量工作并且可以接受长时间暂停时,应使用此收集器。例如,批处理,例如打印报告或账单或执行大量的数据库查询
并发标记扫描(CMS)收集器
并发标记扫描(CMS)收集器(也称为并发低暂停收集器)收集有期限的世代。它尝试通过与应用程序线程同时执行大多数垃圾回收工作来最大程度地减少由于垃圾回收导致的暂停。通常,并发的低暂停收集器不会复制或压缩活动对象。无需移动活动对象即可完成垃圾回收。如果碎片成为问题,请分配更大的堆。
注意:年轻一代的CMS收集器使用与并行收集器相同的算法。
使用案例
CMS收集器应用于需要短暂停时间并可以与垃圾收集器共享资源的应用程序。示例包括响应事件的桌面UI应用程序,响应请求的Web服务器或响应查询的数据库。
命令行开关
要启用CMS收集器,请使用:
-XX:+UseConcMarkSweepGC
并设置线程数,请使用
-XX:ParallelCMSThreads=<n>
用于启动的示例命令行:
java -Xmx12m -Xms3m -Xmn1m -XX:PermSize=20m -XX:MaxPermSize=20m -XX:+UseConcMarkSweepGC -XX:ParallelCMSThreads=2 -jar c:\javademos\demo\jfc\Java2D\Java2demo.jar
G1垃圾收集器
Java 7中提供了Garbage First或G1垃圾收集器,旨在长期替代CMS收集器。G1收集器是并行,并发且渐进压缩的低暂停垃圾收集器,其布局与前面所述的其他垃圾收集器截然不同.
命令行开关
要启用G1收集器,请使用
-XX:+UseG1GC
Here is a sample command line for starting the Java2Demo:
java -Xmx12m -Xms3m -XX:+UseG1GC -jar c:\javademos\demo\jfc\Java2D\Java2demo.jar
G1收集器和前几种垃圾收集器不一样,我们来重点了解下:
G1 GC是Jdk7的新特性之一、Jdk7+版本都可以自主配置G1作为JVM GC选项;作为JVM GC算法的一次重大升级、DK7u后G1已相对稳定、且未来计划替代CMS、所以有必要深入了解下:
不同于其他的分代回收算法、G1将堆空间划分成了互相独立的区块。每块区域既有可能属于O区、也有可能是Y区,且每类区域空间可以是不连续的(对比CMS的O区和Y区都必须是连续的)。这种将O区划分成多块的理念源于:当并发后台线程寻找可回收的对象时、有些区块包含可回收的对象要比其他区块多很多。虽然在清理这些区块时G1仍然需要暂停应用线程、但可以用相对较少的时间优先回收包含垃圾最多区块。这也是为什么G1命名为Garbage First的原因:第一时间处理垃圾最多的区块。
G1相对于CMS的区别在:
G1在压缩空间方面有优势
G1通过将内存空间分成区域(Region)的方式避免内存碎片问题
Eden, Survivor, Old区不再固定、在内存使用效率上来说更灵活
G1可以通过设置预期停顿时间(Pause Time)来控制垃圾收集时间避免应用雪崩现象
G1在回收内存后会马上同时做合并空闲内存的工作、而CMS默认是在STW(stop the world)的时候做
G1会在Young GC中使用、而CMS只能在O区使用
以下场景下G1更适合:
服务端多核CPU、JVM内存占用较大的应用(至少大于4G)
应用在运行过程中会产生大量内存碎片、需要经常压缩空间
想要更可控、可预期的GC停顿周期;防止高并发下应用雪崩现象
一次完整G1GC的详细过程:
G1在运行过程中主要包含如下4种操作方式:
YGC(不同于CMS)
并发阶段
混合模式
full GC (一般是G1出现问题时发生)
YGC:
下面是一次YGC前后内存区域是示意图:
图中每个小区块都代表G1的一个区域(Region),区块里面的字母代表不同的分代内存空间类型(如[E]Eden,[O]Old,[S]Survivor)空白的区块不属于任何一个分区;G1可以在需要的时候任意指定这个区域属于Eden或是O区之类的。
G1 YoungGC在Eden充满时触发,在回收之后所有之前属于Eden的区块全变成空白。然后至少有一个区块是属于S区的(如图半满的那个区域),同时可能有一些数据移到了O区。
使用PrintGCDetails参数打出GC日志、这个参数对G1同样有效、但日志内容颇为不同;下面是一个Young GC的例子:
23.430: [GC pause (young), 0.23094400 secs]
...
[Eden: 1286M(1286M)->0B(1212M)
Survivors: 78M->152M Heap: 1454M(4096M)->242M(4096M)]
[Times: user=0.85 sys=0.05, real=0.23 secs]
上面日志的内容解析:Young GC实际占用230毫秒、其中GC线程占用850毫秒的CPU时间
E:内存占用从1286MB变成0、都被移出
S:从78M增长到了152M、说明从Eden移过来74M
Heap:占用从1454变成242M、说明这次Young GC一共释放了1212M内存空间
很多情况下,S区的对象会有部分晋升到Old区,另外如果S区已满、Eden存活的对象会直接晋升到Old区,这种情况下Old的空间就会涨
并发阶段:
一个并发G1回收周期前后内存占用情况如下图所示:
从上面的图表可以看出以下几点:
1、Young区发生了变化、这意味着在G1并发阶段内至少发生了一次YGC(这点和CMS就有区别),Eden在标记之前已经被完全清空,因为在并发阶段应用线程同时在工作、所以可以看到Eden又有新的占用
2、一些区域被X标记,这些区域属于O区,此时仍然有数据存放、不同之处在G1已标记出这些区域包含的垃圾最多、也就是回收收益最高的区域
3、在并发阶段完成之后实际上O区的容量变得更大了(O+X的方块)。这时因为这个过程中发生了YGC有新的对象进入所致。此外,这个阶段在O区没有回收任何对象:它的作用主要是标记出垃圾最多的区块出来。对象实际上是在后面的阶段真正开始被回收
G1并发标记周期可以分成几个阶段、其中有些需要暂停应用线程。第一个阶段是初始标记阶段。这个阶段会暂停所有应用线程-部分原因是这个过程会执行一次YGC、下面是一个日志示例:
50.541: [GC pause (young) (initial-mark), 0.27767100 secs]
[Eden: 1220M(1220M)->0B(1220M)
Survivors: 144M->144M Heap: 3242M(4096M)->2093M(4096M)]
[Times: user=1.02 sys=0.04, real=0.28 secs]
上面的日志表明发生了YGC、应用线程为此暂停了280毫秒,Eden区被清空(71MB从Young区移到了O区)。
日志里面initial-mark的字样表明后台的并发GC阶段开始了。因为初始标记阶段本身也是要暂停应用线程的,
G1正好在YGC的过程中把这个事情也一起干了。为此带来的额外开销不是很大、增加了20%的CPU,暂停时间相应的略微变长了些。
接下来,G1开始扫描根区域、日志示例:
50.819: [GC concurrent-root-region-scan-start]
51.408: [GC concurrent-root-region-scan-end, 0.5890230]
一共花了580毫秒,这个过程没有暂停应用线程;是后台线程并行处理的。这个阶段不能被YGC所打断、因此后台线程有足够的CPU时间很关键。如果Young区空间恰好在Root扫描的时候
满了、YGC必须等待root扫描之后才能进行。带来的影响是YGC暂停时间会相应的增加。这时的GC日志是这样的:
350.994: [GC pause (young)
351.093: [GC concurrent-root-region-scan-end, 0.6100090]
351.093: [GC concurrent-mark-start],0.37559600 secs]
GC暂停这里可以看出在root扫描结束之前就发生了,表明YGC发生了等待,等待时间大概是100毫秒。
在root扫描完成后,G1进入了一个并发标记阶段。这个阶段也是完全后台进行的;GC日志里面下面的信息代表这个阶段的开始和结束:
111.382: [GC concurrent-mark-start]
....
120.905: [GC concurrent-mark-end, 9.5225160 sec]
并发标记阶段是可以被打断的,比如这个过程中发生了YGC就会。这个阶段之后会有一个二次标记阶段和清理阶段:
120.910: [GC remark 120.959:
[GC ref-PRC, 0.0000890 secs], 0.0718990 secs]
[Times: user=0.23 sys=0.01, real=0.08 secs]
120.985: [GC cleanup 3510M->3434M(4096M), 0.0111040 secs]
[Times: user=0.04 sys=0.00, real=0.01 secs]
这两个阶段同样会暂停应用线程,但时间很短。接下来还有额外的一次并发清理阶段:
120.996: [GC concurrent-cleanup-start]
120.996: [GC concurrent-cleanup-end, 0.0004520]
到此为止,正常的一个G1周期已完成–这个周期主要做的是发现哪些区域包含可回收的垃圾最多(标记为X),实际空间释放较少。
混合GC:
接下来G1执行一系列的混合GC。这个时期因为会同时进行YGC和清理上面已标记为X的区域,所以称之为混合阶段,下面是一个混合GC执行的前后示意图:
像普通的YGC那样、G1完全清空掉Eden同时调整survivor区。另外,两个标记也被回收了,他们有个共同的特点是包含最多可回收的对象,因此这两个区域绝对部分空间都被释放了。这两个区域任何存活的对象都被移到了其他区域(和YGC存活对象晋升到O区类似)。这就是为什么G1的堆比CMS内存碎片要少很多的原因–移动这些对象的同时也就是在压缩对内存。下面是一个混合GC的日志:
79.826: [GC pause (mixed), 0.26161600 secs]
....
[Eden: 1222M(1222M)->0B(1220M)
Survivors: 142M->144M Heap: 3200M(4096M)->1964M(4096M)]
[Times: user=1.01 sys=0.00, real=0.26 secs]
上面的日志可以注意到Eden释放了1222MB、但整个堆的空间释放内存要大于这个数目。数量相差看起来比较少、只有16MB,但是要考虑同时有survivor区的对象晋升到O区;另外,每次混合GC只是清理一部分的O区内存,整个GC会一直持续到几乎所有的标记区域垃圾对象都被回收,这个阶段完了之后G1会重新回到正常的YGC阶段。周期性的,当O区内存占用达到一定数量之后G1又会开启一次新的并行GC阶段.
网友评论