JAVA虚拟机-垃圾收集器
从上一章节,我们知道运行期数据区域可能发生内存泄露问题,那么为了有效防止内存泄露问题,我们引入垃圾收集机制,将垃圾回收,释放更多的内存来。说起垃圾收集器,我们需要先考虑三个问题:
-
哪些对象需要回收?
-
什么时候回收?(new 的时候,就会检查内存是否够,然后是否回收之类的事情)
-
回收策略?
先来回答第一个问题,哪些对象需要回收呢?所谓的垃圾,就是没用的,这里可以说是已死的对象,或者说是没有任何用处的对象,那么我们如何判断这个对象已死呢?Stop-the-World,在讨论垃圾收集时,我们一定要记得这个词语,Stop-the-world意味着JVM由于要执行GC而停止了应用程序的执行,并且这种情形会在任何一种GC算法中发生,也就是说当JVM在GC时,其他线程都必须出于等待状态。
1.判断对象已死
如何判断这个对象已死,就是任何地方都没有引用到这个对象了就说明它已死,垃圾回收器可以回收了,这里介绍
1.1 引用技术算法
-
概念
给每个对象添加一个引用计数器,对象被引用,则引用计数器加1。当引用失效时,则引用计数器减1。当引用计数器为0时,表示该对象已死,可以被回收。
-
优点
- 实现简单,判定效率高。
-
缺点
- 无法判断互相循环引用的对象是否已死。比如:A,B都有一个object对象,A.object = B,B.object=A,此时我们让A=null,B= null,我们知道这个时候A,B此时这两个对象也没有任何其他引用,但是由于彼此相互有引用,因此引用计数器不可能为0,此时A,B都无法回收。
1.2 根搜索算法
-
概念
通过一些列名为“GC roots”的结点作为起始点,从这些结点开始向下搜索,搜索所走过的路径称为引用链,当一个对象没有任何到达GC root的引用链时,这个对象不可达,可以被回收。简而言之就是从GC Roots到某个对象不可达就表示这个对象可以被回收。
在java中,可以被用作GC roots的对象包含:
-
java虚拟机栈中变量表中的引用的对象
-
方法区中类静态常量的引用的对象
-
方法区中常量引用的对象
-
本地方法区JNI的引用的对象
-
2.引用
如果说引用,我们只是以为引用可以被回收和不可以被回收的区别,那么就太单调了,我们其实更希望,如果有内存的时候,可以不回收,如果没有内存的时候,可以被回收,或者认为内存经过垃圾回收之后仍然不够,可以抛弃这些引用。这个时候,引用就需要更精细的分类了。分为:强引用,弱引用,软引用,虚引用。
-
强引用
强引用就是代码中常见的那种,诸如:Object obj = new Object();obj就是强引用,只要这个强引用还存在,垃圾回收器是不能回收这个引用的。
-
软引用
软引用用来描述一些还有用,但是不是必须的对象。对于软引用关联的对象,在抛出内存溢出异常之前,这些对象会被列为回收范围进行第二次垃圾回收,只有在这之后如果内存仍然不够,才抛出内存溢出异常。
软引用主要用户实现类似缓存的功能,在内存足够的情况下直接通过软引用取值,无需从繁忙的真实来源查询数据,提升速度;当内存不足时,自动删除这部分缓存数据,从真正的来源查询这些数据。
-
弱引用
被弱引用关联的对象,只要下一次垃圾回收器开始回收,无论当前内存是否足够,就会把这类对象回收了。
-
虚引用
虚引用是每次垃圾回收的时候都会被回收,虚引用主要用于检测对象是否已经从内存中删除。
3.垃圾收集算法
3.1 标记-清除算法
-
概念
标记-清除算法是最基本的垃圾收集算法,分为两个过程:先标记能被垃圾收集的,然后清除掉这些被标记的对象。
-
缺点
-
效率问题。标记和清除两个过程效率都不高。
-
空间问题。标记-清除算法回收之后,可能存在大片不连续的空间,这样就导致如果后面有一个需要连续空间的大对象被分配内存,就会又触动一次垃圾回收。
-
3.2 复制算法
-
概念
就是将内存分为大小相等的两块A,B,每次只使用一块。每次垃圾回收时,先把A内存中存活的对象复制到另一块空的内存B中,然后一次性清除掉A内存。
-
缺点
可使用的内存边小了一半,代价太高。这样有可能在对象实例化时,提前触发垃圾回收。
3.3 标记-整理算法
-
概念
和标记-清理算法很像,首先要做的是标记出能被回收的,但后续不是直接清理掉这些被标记的对象,而是删除了未引用对象后,将剩下的存活对象放到内存的一端A,这样内存的另一端B就是一块连续未被占用的空间。
3.4 分代收集算法
-
概念
实际上,我们内存中很多对象存活时间很短,IBM专门研究表明,新生代中98%的对象是朝生夕死的,因此以上三种算法都不是最好的。当前商业虚拟机采用的是这种分代收集算法。主要根据对象的存活周期将内存分为:新生代,老年代,永生代。
堆按照对象生命周期分类.png
我们来看看分代收集算法是如何针对堆内存进行回收的:
* 新生代
新生代采用的是复制算法。新生代先分为eden,s0,s1三块区域,新对象一般都分配在eden区域,如果eden区域满了触动垃圾回收,就把eden存活的对象复制到S0区域,然后清除掉eden区域。在下一次垃圾收集时,如果eden区域满了,S0和eden区域的存活对象会被复制到S1中,然后eden和S0会被清空。在这个过程中,幸存的对象会随着每次触动垃圾收集,年龄也在增长。如果触动下一次垃圾收集,过程是一样的,但是这次换成把所有的存活对象复制到S0中,然后清理掉eden和S1区域,而此时,这些存活对象的年龄也增长了。当这些存活的对象年龄达到了新生代年龄阈值,就会进入到下一个区域,老年代。
* 老年代
老年代中使用“标记-清除”或者“标记-整理”算法进行垃圾回收,回收次数相对较少,每次回收时间比较长。在垃圾收集整个过程中,不管是处于新生代,还是老年代,都必须记住**Stop the World 事件** ,就是说在这种事件发生时,所有的程序线程都要暂停,直到事件完成(比如这里就是完成了所有回收工作)为止。Major GC 也会触发STW(Stop the World)。通常,Major GC会慢很多,因为它涉及到所有存活对象。所以,对于响应性的应用程序,应该尽量避免Major GC。
* 永久代
包含JVM用于描述应用程序中类和方法的元数据。永久代是由JVM在运行时根据应用程序使用的类来填充的。如果JVM发现某些类不再需要,并且其他类可能需要空间,则这些类可能会被回收。
4.垃圾收集器
4.1 Serial收集器
Serial收集器是最基本,也是历史最久的收集器。在垃圾收集过程中是单线程的,会发生STW事件(stop the word事件)。
Serial收集器依然是虚拟机运行在Client模式下默认新生代收集器,对于运行在Client模式下的虚拟机来说是一个很好的选择。
serial垃圾收集器.png4.2 ParNew收集器
ParNew收集器其实就是Serial收集器的多线程版本,除了使用多线程进行垃圾收集之外,其余行为包括Serial收集器可用的所有控制参数、收集算法、Stop The Worl、对象分配规则、回收策略等都与Serial 收集器完全一样。
ParNew收集器是许多运行在Server模式下的虚拟机中首选新生代收集器,其中有一个与性能无关但很重要的原因是,除Serial收集器之外,目前只有ParNew它能与CMS收集器配合工作。
4.3 Parallel Scavenge收集器
Parallel Scavenge收集器也是一个新生代收集器,并行的多线程收集器。
该收集器的目标是达到一个可控制的吞吐量(Throughput)。所谓吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值,即 吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)
停顿时间越短就越适合需要与用户交互的程序,良好
的响应速度能提升用户体验,而高吞吐量则可用高效率地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。
Parallel Scavenge收集器提供两个参数用于精确控制吞吐量,分别是控制最大垃圾收起停顿时间的
-XX:MaxGCPauseMillis参数以及直接设置吞吐量大小的-XX:GCTimeRatio参数
Parallel Scavenge收集器还有一个参数:-XX:+UseAdaptiveSizePolicy。这是一个开关参数,当这个参数打开后,就不需要手工指定新生代的大小(-Xmn)、Eden与Survivor区的比例(-XX:SurvivorRatio)、晋升老年代对象年龄(-XX:PretenureSizeThreshold)等细节参数,只需要把基本的内存数据设置好(如-Xmx设置最大堆),然后使用MaxGVPauseMillis参数或GCTimeRation参数给虚拟机设立一个优化目标。
自适应调节策略也是Parallel Scavenge收集器与ParNew收集器的一个重要区别
4.4 Serial Old收集器
Serial Old是Serial收集器的老年代版本,它同样是一个单线程收集器,使用标记整理算法。这个收集器的主要意义也是在于给Client模式下的虚拟机使用。
如果在Server模式下,主要两大用途:
(1)在JDK1.5以及之前的版本中与Parallel Scavenge收集器搭配使用
(2)作为CMS收集器的后备预案,在并发收集发生Concurrent Mode Failure时使用
4.5 Parallel Old收集器
Parallel Old 是Parallel Scavenge收集器的老年代版本,使用多线程和“标记-整理”算法。这个收集器在1.6中才开始提供。
4.6 CMS收集器
CMS(Concurrent Mark Sweep)收集器是一种以获取最短回收停顿时间为目标的收集器。目前很大一部分的Java应用集中在互联网站或者B/S系统的服务端上,这类应用尤其重视服务器的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。CMS收集器就非常符合这类应用的需求
CMS收集器是基于“标记-清除”算法实现的。它的运作过程相对前面几种收集器来说更复杂一些,整个过程分为4个步骤:
(1)初始标记
(2)并发标记
(3)重新标记
(4)并发清除
其中,初始标记、重新标记这两个步骤仍然需要“Stop The World”.
CMS收集器主要优点:并发收集,低停顿。
CMS三个明显的缺点:
(1)CMS收集器对CPU资源非常敏感。CPU个数少于4个时,CMS对于用户程序的影响就可能变得很大,为了应付这种情况,虚拟机提供了一种称为“增量式并发收集器”的CMS收集器变种。所做的事情和单CPU年代PC机操作系统使用抢占式来模拟多任务机制的思想
(2)CMS收集器无法处理浮动垃圾,可能出现“Concurrent Mode Failure”失败而导致另一次Full GC的产生。在JDK1.5的默认设置下,CMS收集器当老年代使用了68%的空间后就会被激活,这是一个偏保守的设置,如果在应用中蓝年代增长不是太快,可以适当调高参数-XX:CMSInitiatingOccupancyFraction的值来提高触发百分比,以便降低内存回收次数从而获取更好的性能,在JDK1.6中,CMS收集器的启动阀值已经提升至92%。
(3)CMS是基于“标记-清除”算法实现的收集器,收集结束时会有大量空间碎片产生。空间碎片过多,可能会出现老年代还有很大空间剩余,但是无法找到足够大的连续空间来分配当前对象,不得不提前触发FullGC。为了解决这个问题,CMS收集器提供了一个-XX:+UseCMSCompactAtFullCollection开关参数(默认就是开启的),用于在CMS收集器顶不住要进行FullGC时开启内存碎片合并整理过程,内存整理的过程是无法并发的,空间碎片问题没有了,但停顿时间变长了。虚拟机设计者还提供了另外一个参数-XX:CMSFullGCsBeforeCompaction,这个参数是用于设置执行多少次不压缩的Full GC后,跟着来一次带压缩的(默认值为0,标识每次进入Full GC时都进行碎片整理)
4.7 G1收集器
G1收集器的优势:
(1)并行与并发
(2)分代收集
(3)空间整理 (标记整理算法,复制算法)
(4)可预测的停顿(G1处处理追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒,这几乎已经实现Java(RTSJ)的来及收集器的特征)
使用G1收集器时,Java堆的内存布局是整个规划为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region的集合。
G1收集器之所以能建立可预测的停顿时间模型,是因为它可以有计划地避免在真个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获取的空间大小以及回收所需要的时间的经验值),在后台维护一个优先列表,每次根据允许的收集时间,优先回收价值最大的Region(这也就是Garbage-First名称的又来)。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限的时间内可以获取尽量可能高的灰机效率
G1 内存“化整为零”的思路
在GC根节点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会遗漏。
如果不计算维护Remembered Set的操作,G1收集器的运作大致可划分为一下步骤:
(1)初始标记
(2)并发标记
(3)最终标记
(4)筛选回收
5.内存分配与回收策略
5.1 优先分配到新生代的eden区域
Eden区满时,进行Minor GC,当Eden和一个Survivor区中依然存活的对象无法放入到Survivor中,则通过分配担保机制提前转移到老年代中。
5.2 大对象直接进入老年代
像需要分配大块连续空间时,比如大的字符串和数组,对于分配这些大的对象,如果在新生代是很麻烦的,增加了eden,和servivor区域的复制复杂度。所以这样的对象一般都是直接通过设置-XX:PreternureSizeThreshold参数,让大于这个设置值的对象直接在老年代中分配。
5.3 长期存活的对象将进入到老年代
虚拟机给每个对象设置了一个年龄计数器,新生代中,每经历一次minorGC,仍然存活在servivor区域的对象,其年龄计数器会加1,直到达到了一定的年龄阈值会直接进入到老年代。而这个年龄阈值通过设置:-XX:MaxTenuringThreshold来设置。
5.4 动态年龄判断
为了适应不同的虚拟机的内存状况,java虚拟机规定无须等到对象的年龄达到MaxTenuringThreshold才可以进入老年代,而是规定,survivor空间中相同年龄对象所占内存大于或等于survivor空间的一半内存,那么大于这个年龄或者等于这个年龄的对象可以进入到老年代中。
5.5 空间分配担保
在发生minor GC时,虚拟机会检测老年代最大可用的连续空间是否大于新生代所有对象的空间,如果是:
-
如果满足,minor gc是安全的,可以进行minor gc。
-
如果不满足,查看HandlePromotionFailure参数:
-
如果为true,允许担保失败,会继续检测老年代最大可用的连续空间>历次晋升到老年代对象的平均大小。若大 于,将尝试进行一次minor gc,若失败,则重新进行一次full gc。
-
如果为false,不允许担保失败。要进行一次full GC。
-
下图就是整理的有关内存分配和回收策略的知识,Java新生代GC多少次后晋升到老年代的对象就可以从这张图分析出来了:
新生代GC升级老年代(1).png
网友评论