垃圾的定义:
从前面我们已经知道GC主要是回收Java堆中的对象,即此对象已经没有了价值,就是变成了“垃圾”,那么对象被判定为垃圾的标准是什么呢?——没有被其他对象引用。
判定对象是否是垃圾的算法:
引用计数算法:主要是判断对象的引用数量。
- 通过判断对象的引用数量来决定对象是否可以被回收
- 每个对象实例都有一个引用计数器,被引用则+1,完成引用则-1(局部变量的生命周期结束)
- 任何引用计数为0的对象实例都可以被当作垃圾收集
优点:执行效率高,程序执行受影响较小
缺点:无法检测出循环引用的情况,导致无法回收垃圾,从而引发内存泄漏
可达性分析算法:通过判断对象的引用链遍历(从GC Root开始)是否可达来决定对象是否可以被回收。
可作为GC Root的对象:
- 虚拟机栈中引用的对象(栈帧中的本地变量表)
- 方法区中的常量引用的对象
- 方法区中的类静态属性引用的对象
- 本地方法栈中JNI(Native方法)的引用对象
- 活跃线程的引用对象
回收垃圾的算法:
标记-清除算法(Mark and Sweep)
标记-清除算法(Mark and Sweep)- 标记:从根集合进行扫描,对存活的对象进行标记(可达性分析算法)
- 清除:对堆内存从头到尾进行线性遍历,回收不可达的对象内存
- 缺点:产生大量的碎片,使得无法给较大的对象分配内存。(下图中BE之间的产生的占用两个单位的不连续碎片)
复制算法(Copying)
复制算法- 分为对象面和空闲面
- 对象在对象面上创建
- 存活的对象被从对象面复制到空闲面
- 将对象面所有对象内存清除
优点:
- 解决了碎片化问题
- 顺序分配内存,简单高效
不足:
- 复制耗费时间,且要浪费一半的内存用作空闲面。
适用场景:适用于对象存活率低的场景(年轻代)
标记-整理算法(Compacting)
升级版的标记-清除算法(Mark and Sweep)
- 标记:从根集合进行扫描,对存活的对象进行标记
- 清除:移动所有存活的对象,且按照内存地址次序依次排列,然后将末端内存地址以后的内存全部回收。
优点:避免了内存的不连续行,防止出现大量内存碎片,不用浪费一半的内存(对比于复制算法)。
适用场景:适用于存活率高的场景(老年代)
标记分代收集算法(Generational Collector)
- 垃圾回收算法的组合拳
- 按照对象生命周期的不同划分区域以采用不同的垃圾回收算法
-
目的:用于提高JVM垃圾回收的效率
JDK1.8及以后堆中的划分如下:
GC的分类
- Minor GC:发生在年轻代(对象出生的地方,该区域的对象几乎都是“朝生夕灭”)中的GC动作,采用的收集算法是复制(需要复制的对象很少)。
- Full GC:主要对老年代(该区域的对象是“幸存”下来的对象,一般不会再轻易“死亡”)的回收,但同时包含了对年轻代的回收(即包含了Minor GC)。采用的收集算法是标记-清除和标记-整理。相比Minor GC慢,执行频率低。
年轻代(Young Generation)
尽可能快速地收集掉那些生命周期短的对象
- Eden(伊甸园)区:
1.正常情况对象刚被创建出来
的时候在eden区,当eden区内存不足时会放到Survivor区,对象很大时会放入老年代。
2.发生Minor GC
后有用对象年龄+1
并被放入到Suvivor区
3.Eden默认占年轻代8的权重,Survivor区两空间分别占1 - 两个Survivor区(from、to):发生
Minor GC
后有用对象年龄+1
,并将存活对象从From使用复制算法到To中,清空From空间,当对象年龄达到一定值后进入老年区(默认15)
老年代(Old Generation):存放多次gc后存活的和一些比较大的对象
对象如何晋升到老年代
- 经历一定Minor GC次数后依然存活的对象
- Survivor区中存放不下的对象
- 新生成的大对象(-XX:+PretenuerSizeThreshold)
常用的调优参数
- -XX:SurvivorRatio:Eden和Survivor的比值,默认8:1:1
- -XX:NewRatio:老年代和年轻代内存的大小比例
- -XX:MAXTenuringThreshold:对象从年轻代晋升到老年代进过GC次数的最大阈值
触发Full GC的条件
- 老年代空间不足
- 永久代空间不足(JDK1.8之前)
- CMS GC时出现promotion failed,concurrent mode failure
- Minor GC晋升到老年代的平均大小大于老年代的剩余空间
- 调用System.gc()(仅是通知,不保证何时执行)
- 使用RMI来进行PRC或管理的JDK应用,每小时执行1此Full GC
常见的垃圾收集器
不同虚拟机所提供的垃圾收集器可能会有很大差别,这里讨论的是HotSpot,HotSpot虚拟机所包含的所有收集器如图:
- Serial收集器(-XX:+UseSerialGC( UseSerialOldGC
老年代
),复制算法)
Serial收集器是最基本、发展历史最久的收集器,是一个采用复制算法的单线程的新生代收集器。
特点:
(1). 针对新生代;
(2). 采用复制算法;
(3). 单线程。 它的“单线程”意义:
a. 它只会使用一个CPU或一条线程去完成垃圾收集工作
b. 它进行垃圾收集时必须暂停其他线程的所有工作,直到它收集结束(STW,Stop The World)。
应用场景:
Serial收集器是虚拟机运行在Client模式下的默认新生代收集器
优点:
简单高效。对于单个CPU环境而言,Serial收集器由于没有线程交互的开销,专心做垃圾收集自然可以获得最高的单线程收集效率。
Serial/Serial Old收集器运行示意图:
-
ParNew收集器(-XX:+UseParNewGC(UseParallelOldGC),复制算法)
ParNew收集器其实就是Serial收集器的多线程版本,在可用控制参数、收集算法、Stop The World、对象分配规则、回收策略等都与Serial收集器完全一样。是一个采用复制算法的并行多线程收集器,是一个新生代收集器。
特点:
(1). 与Serial收集器相同的特点:
a. 针对新生代;
b. 采用复制算法;
c. STW
(2). 主要特点:
多线程。使用多线程进行垃圾收集。
应用场景:
它是Server模式下的虚拟机首选的新生代收集器。但在单个CPU环境中,不会比Serail收集器有更好的效果,因为存在线程交互的开销。
ParNew/Serial Old收集器运行示意图:
-
Parrallel Scanvenge收集器(-xx:+UseParallelGC(UseParallelOldGC),复制算法)
Parallel Scavenge收集器也是一个采用复制算法的并行多线程收集器,是一个新生代收集器。Parallel Scavenge收集器因为与吞吐量关系密切,也称为吞吐量收集器。
特点:
(1). 与ParNew收集器相同的特点:
a. 新生代收集器;
b. 采用复制算法;
c. 多线程收集;
(2). 主要特点:
Parallel Scavenge收集器的目标是达一个可控制
的吞吐量,而CMS等收集器的关注点是尽可能地缩短垃圾收集时用户线程的停顿时间。
所谓吞吐量的意思就是CPU用于运行用户代码时间与CPU总消耗时间的比值
,即吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间),虚拟机总运行100分钟,垃圾收集1分钟,那吞吐量就是99%。
应用场景:
1.高吞吐量为目标,即减少垃圾收集时间,让用户代码获得更长的运行时间。
2.当应用程序运行在具有多个CPU上,对暂停时间没有特别高的要求时,即程序主要在后台进行计算,而不需要与用户进行太多交互。例如,那些执行批量处理、订单处理、工资支付、科学计算的应用程序
-
CMS收集器(-XX:+UseConcMarkSweepGC,标记-清除算法)
- 初始标记:stop-the-world
- 并发标记:并发追溯标记,程序不会停顿
- 并发预清理:查找执行并发标记阶段从年轻代晋升到老年代的对象
- 重新标记:暂停虚拟机,扫描CMS堆中的剩余对象
- 并发清理:清理垃圾对象,程序不会停顿
- 并发重置:重置CMS收集器的数据结构
Stop-the-World
- JVM由于要执行GC而停止应用程序的执行
- 任何一种GC算法中都会发生
- 多数GC优化通过减少Stop-the-world发生的时间来提高程序性能
Safepoint
- 分析过程中对象引用关系不会发生变化的点
- 产生Safepoint的地方:方法调用、循环跳转、异常跳转等
- 安全点数量要适中(太少会让GC等待太长的时间,太多增加了程序运行的负荷)
JVM的运行模式
- Server:重量级级启动,速度较慢,优化更多
- Client:轻量级启动,速度快
GC相关面试
Object的finalize()方法的作用是否与C++的析构函数的作用相同?
- 与C++的析构函数不同,析构函数的调用时机(离开作用域)是确定的,而它是不确定的
- 将未被引用的对象放置于F-Queue队列
- 方法执行随时可能会被终止
- 给予对象最后一次重生的机会
代码实例:
public class Finalization {
public static Finalization finalization;
@Override
protected void finalize() {
System.out.println("Finalized");
finalization = this;
}
public static void main(String[] args) {
Finalization f = new Finalization();
System.out.println("First print: " + f);
f = null;
System.gc();
try { //休息一段时间,确保GC线程执行完成
Thread.currentThread().sleep(1000);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println("Second print: " + f);
System.out.println(f.finalization);
}
}
输出:
First print: com.interview.javabasic.jvm.gc.Finalization@4554617c
Finalized
Second print: null
com.interview.javabasic.jvm.gc.Finalization@4554617c
Java中的强引用,软引用,弱引用,虚引用的作用?
强引用(Strong Reference)
- 最普遍的引用:Object ob = new Object()
- 抛出OutOfMemoryError终止程序也不会回收具有强引用的对象
- 通过将对象设置为null来弱化引用,使其被回收
软引用(Soft Reference)
-
对象处在有用当非必须的状态
-
只有当内存空间不足时,GC才会回收该引用的对象的内存
-
可以用来实现高速缓存
String str = new String("abc"); //强引用
SoftReference softRef = new SoftReference(str); //软引用
弱引用(Weak Reference)
-
非必须的对象,比软引用更弱一些,也可以用作缓存
-
只要GC就会被回收
-
被回收的概率也不大,因为GC线程优先级比较低
-
适用于引用偶尔被使用且不影响垃圾收集的对象
String str = new String("abc");
WeakReference weakRef = new WeakReference(str);
虚引用(PhantomReference)
-
不会决定对象的生命周期
-
任何时候都可能被GC
-
跟踪对象被GC的活动,起哨兵作用
-
必须和引用队列ReferenceQueue联合使用
String str = new String("abc");
ReferenceQueue queue = new ReferenceQueue();
PhantomReference ref = new PhantomReference(str, queue);
总结:
引用类型 | 垃圾回收时间 | 用途 | 生存时间 |
---|---|---|---|
强引用 | 从来不会 | 对象的一般状态 | JVM停止运行时 |
软引用 | 在内存不足时 | 对象缓存 | 内存不足时终止 |
弱引用 | 在垃圾回收时 | 对象缓存 | gc运行后终止 |
虚引用 | Unknown | 标记、哨兵 | Unknown |
网友评论