一文理清JVM和GC（上）

作者: 菜农曰 | 来源:发表于2020-04-06 19:50 被阅读0次

本文主要介绍JVM和GC解析
本文较长，分为上下篇（可收藏，勿吃尘）
如有需要，可以参考
如有帮助，不忘点赞 ❥

一、前期预热

1）JVM内存体系

其中方法区和堆被JVM中多个线程共享，比如类的静态常量就被存放在方法区，供类对象之间共享，虚拟机栈、本地方法栈、程序计数器是每个线程独立拥有的，不会与其他线程共享。所以Java在通过new创建一个类对象实例的时候，一方面会在虚拟机栈中创建一个对该对象的引用，另一方面会在堆上创建类对象的实例，然后将对象引用指向该对象的实例。对象引用存放在每一个方法对应的栈帧中。

图片来源于网上

虚拟机栈：虚拟机栈中执行每个方法的时候，都会创建一个栈帧用于存储局部变量表，操作数栈，动态链接，方法出口等信息。
本地方法栈：与虚拟机栈发挥的作用相似，相比于虚拟机栈为Java方法服务，本地方法栈为虚拟机使用的Native方法服务，执行每个本地方法的时候，都会创建一个栈帧用于存储局部变量表，操作数栈，动态链接，方法出口等信息。
方法区：它用于存储已被虚拟机加载的类信息，常量，静态变量，即时编译器编译后的代码等数据，方法区在JDK1.7版本及之前称为永久代，从JDK1.8之后永久代被移除。
堆：堆是Java对象的存储区域，任何new字段分配的Java对象实例和数组，都被分配在了堆上，Java堆可使用 - Xms / - Xmx 进行内存控制，从JDK1.7版本之后，运行时常量池从方法区移到了堆上。
程序计数器：指示Java虚拟机下一条需要执行的字节码指令。

2）JAVA8之后的JVM

从图中我们可以看出JAVA8的JVM 用元空间取代了永久代

---

3）GC作用域

---

4）常见垃圾回收算法

引用计数法：

JVM的实现一般不采用这种方式

---

缺点：
1. 每次对对象赋值时均要维护引用计数器，且计数器本身也有一定的消耗；
2. 较难处理循环引用；

复制算法：

Java 堆从GC的角度可以细分为：新生代（Eden区、From Survivor区和 To Survivor区）和老年代。
特点：
复制算法不会产生内存碎片，但会占用空间。用于新生代。

---
MinorGC的过程（复制 --> 清空 --> 互换）

复制： （Eden、SurvivorFrom 复制到 SurvivorTo，年龄加1）
首先，当Eden区满的时候会触发第一次GC，把还活着的对象拷贝到SurvivorFrom区，当Eden区再次触发GC的时候会扫描Eden区域和From区域，对这两个区域进行垃圾回收，经过这次回收后还存活的对象，则直接复制到To区域（如果有对象的年龄已经到达了老年的标准，则复制到老年代区），同时把这些对象的年龄加1。
清空：（清空Eden、SurvivorFrom）
清空Eden和SurvivorFrom中的对象，也即复制之后有交换，谁空谁是to。
互换：(SurvivorTo和SurvivorFrom 互换)
最后，SurvivorTo和SurvivorFrom 互换，原SurvivorTo成为下一次GC是的SurvivorFrom区。

标记清除法

算法分成标记和清除两个阶段，先标记出要回收的对象，然后统一回收这些。
特点：
不会占用额外空间，但会扫描两次，耗时，容易产生碎片，用于老年代

---

标记压缩法

优点：
没有内存碎片，可以利用bump
缺点：
需要移动对象的成本，用于老年代
原理：

标记：与标记清除一样

---

2.压缩：再次扫描，并往一段滑动存活对象

---

二、正文接入

1）判断对象是否可回收

引用计数法

Java中，引用和对象是有关联的。如果要操作对象则必须用引用进行。
因此，很显然的一个方法就是通过引用计数来判断一个对象是否可以回收。简单来说就是给对象添加一个引用计数器。每当有一个地方引用它，计数器的值加1，每当有一个引用失效时，计数器的值减1。
任何时刻计数器值为0的对象就是不可能再被使用的，那么这个对象就是可回收对象。
缺点： 很难解决对象之间相互循环引用的问题

---

枚举根节点做可达性分析(根搜索路径)

所谓“GC roots” 或者说tracing GC 的 "根集合" 就是一组必须活跃的引用。
基本思路就是通过一系列名为“GC Roots” 的对象作为起始点，从这个被称为GC Roots的对象开始向下搜索，如GC Roots没有任何引用链相连是，则说明此对象不可用。也即给定一个集合的引用作为根出发，通过引用关系

图片来源于网上

2）哪些可以做GCRoots对象

虚拟机栈（栈帧中的局部变量区，也叫做局部变量表）
方法区中的类静态属性引用的对象
方法区中常量引用的对象
本地方法栈中N（Native方法）引用的对象

3）JVM的参数类型

标配参数
- java -version
- java -help
  
  ---
X参数
- java -Xint -version ：解释执行
- java -Xcomp -version ：第一次使用就编译成本地代码
- java -Xmixed ：混合模式
  
  ---
XX参数
- Boolean类型
-XX：+ 或者 - 某个属性值
+：表示开启
-：表示关闭
例子：
-XX: +PrintGCDetails： 开启打印GC收集细节
-XX: -PrintGCDetails： 关闭打印GC收集细节
-XX: +UseSerialGC： 开启串行垃圾收集器
-XX: -UseSerialGC： 关闭串行垃圾收集器
- KV设置类型
-XX: 属性key = 属性value
例子：
-XX: MetaspaceSize = 128m：设置元空间大小为128m
-XX:MaxTenuringThreshold = 15： 控制新生代需要经历多少次GC晋升到老年代中的最大阈值
- jinfo-查看当前运行程序的配置
公式： jinfo -flag 配置项进程编号
例子：
1. 查看初始堆大小：
  
  ---
2. 查看其他参数
  
  ---
3. 查看使用哪种垃圾回收器
  
  ---
两个经典参数
- -Xms 等价于 -XX: InitialHeapSize
- -Xmx 等价于 -XX: MaxHeapSize

4）查看JVM默认值

-XX:+PrintFlagsInitial 查看默认初始值

java -XX: +PrintFlagsInitial -version
java -XX: +PrintFlagsInitial

---

-XX:+PrintFlagsFinal 查看修改更新
- java -XX:+PrintFlagsFinal
- java -XX:+PrintFlagsFinal -version
- java -XX:+PrintCommandedLineFlags
  
  ---

5）常用的配置参数

经典案例设置：
-Xms128m -Xmx4096m -Xss1024k -XX:Metaspacesize=512m -XX:+PrintCommandLineFlags -XX:PrintGCDetails -XX:UseSerialGC

-Xms

初始化大小内存，默认为物理内存1/64
等价于 -XX:InitialHeapSize

-Xmx

最大分配内存，默认为物理内存1/4
等价于 -XX:MaxHeapSize

-Xss

设置单个线程的大小，一般默认为5112K~1024K
等价于 -XX:ThreadStackSize

-Xmn

设置年轻代大小

-XX:MetaspaceSize

设置元空间大小

---

-XX:+PrintGCdetails

输出详细的GC收集日志信息

---
---

-XX:SurvivorRatio

设置新生代中eden和S0/S1空间的比例
默认：
-XX:SurvivorRatio=8 --> Eden:S0:S1=8:1:1
修改：
-XX:SurvivorRatio=4 --> Eden:S0:S1=4:1:1
SurvivorRatio值就是设置eden区的比例占多少，S0/S1相同

-XX:NewRatio

设置年轻代与老年代在堆结构的占比
默认
-XX:NewRatio=2 新生代占1，老年代占2，年轻代占整个堆的1/3
修改
-XX:NewRatio=4 新生代占1，老年代占4，年轻代占整个堆的1/5
NewRatio值就是设置老年代的占比，剩下的1给新生代

-XX:MaxTenuringThreshold

设置垃圾最大年龄
-XX:MaxTenuringThreshold=0：设置垃圾最大年龄。如果设置为0的话，则年轻代对象不经过Survivor区，直接进入老年代。对于老年代比较多的应用，可以提高效率。如果将此值设置为一个较大值，则年轻代对象会在Survivor区进行多次复制，这样可以增加对象在年轻代的存活时间，增加年轻代被回收的概论。

6）强软弱虚

图片来源于网络

强引用
- 当内存不足，JVM开始垃圾回收，对于强引用的对象，就算出现了OOM也不会对该对象进行回收，死都不收
- 强引用是我们最常见的普通对象引用，只要还有强引用指向一个对象，就能表名对象还“活着”，垃圾收集器不会碰这种对象。在Java中最常见的就是强引用，把一个对象赋给一个引用变量，这个引用变量就是一个强引用。当一个对象被强引用变量引用时，它处于可达状态，它是不可能被垃圾回收机制回收的。即使该对象以后永远都不会被用到，JVM也不会回收。 因此强引用是造成Java内存泄漏的主要原因之一。
- 对于一个普通的对象，如果没有其他的引用关系，只要超过了引用的作用域或者显式地将相应（强）引用赋值为null，一般就是认为可以被垃圾收集（具体看垃圾收集策略）

public static void main(String[] args) {
        Object o1 = new Object();   //默认为强引用
        Object o2 = o1;     //引用赋值
        o1 = null;          //置空 让垃圾收集
        System.gc();
        System.out.println(o1);     // null
        System.out.println(o2);     // java.lang.Object@1540e19d
    }

软引用
- 软引用就是一种相对强引用弱化了一些的引用。需要用java.lang.ref.SoftReference类来实现，可以让对象豁免一些垃圾收集。
- 系统内存充足 -> 不会回收
- 系统内存不足 -> 会回收
- 软引用通常用在对内存敏感的程序中，比如高速缓存就有用到软引用，内存够用的时候就保留，不够用就回收

    public static void main(String[] args) {
        Object o1 = new Object();
        SoftReference softReference = new SoftReference(o1);
        o1 = null;
        System.gc();
        System.out.println(o1);
        System.out.println(softReference.get());
    }

弱引用
- 弱引用需要用java.lang.ref.WeakReference类来实现，它比软引用的生存期更短
- 对于弱引用的对象，只要垃圾回收机制一运行，不管JVM的内存空间是否足够，都会回收该对象占用的内存。

    public static void main(String[] args) {
        Object o1 = new Object();
        WeakReference weakReference = new WeakReference(o1);
        o1 = null;
        System.gc();
        System.out.println(o1);                     //null
        System.out.println(weakReference.get());    //null
    }

虚引用
- 虚引用需要java.lang.ref.PhantomReference类来实现。
- 形如虚设，它不会决定对象的生命周期。
- 如果一个对象持有虚引用，那么它就和没有任何一样，在任何时候都可能被垃圾回收器回收， 它不能单独使用也不能通过它来访问对象，虚引用必须和引用队列（ReferenceQueue）联合使用。
- 虚引用的主要作用是跟踪对象被垃圾回收的状态，仅仅是提供了一种确保对象被finalize以后，做某些事情的机制。PhantomReference的get方法总是返回null，因此无法访问对应的引用对象。其意义在于说明一个对象已经进入finalization阶段，可以被gc回收，用来实现比finalization机制更灵活的回收操作。

public static void main(String[] args) {
        Object o1 = new Object();
        ReferenceQueue<Object> referenceQueue = new ReferenceQueue<>();
        PhantomReference<Object> phantomReference = new PhantomReference<>(o1,referenceQueue);
        System.out.println(o1);                         //java.lang.Object@1540e19d
        System.out.println(phantomReference.get());     //null
        System.out.println(referenceQueue.poll());      //null
    }

扩展
- 软弱引用适用场景
假如有一个引用需要读取大量的本地图片
存在问题：
1. 如果每次读取图片都从硬盘读取则会严重影响性能。
2. 如果一次性全部加载到内存中有可能造成内存溢出。
>解决思路：
> 用一个HashMap来保存图片的路径和相应图片对象关联的软引用之间的映射关系，在内存不足时，JVM会自动回收这些缓存图片对象所占用的空间，从而有效地避免了OOM的问题。
Map<String,SoftReference> imgMap = new HashMap<String,SoftReference>();
- WeakHashMap

public static void main(String[] args) {
        WeakHashMap<Integer,String> weakHashMap = new WeakHashMap<>();
        Integer key = new Integer(1);
        weakHashMap.put(key,"测试1");
        System.out.println(weakHashMap);    //{1=测试1}
        key=null;
        System.out.println(weakHashMap);    //{1=测试1}
        System.gc();
        System.out.println(weakHashMap+"\t"+weakHashMap.size());    //{} 0
    }

一文理清JVM和GC（上）

一、前期预热

1）JVM内存体系

2）JAVA8之后的JVM

3）GC作用域

二、正文接入

1）判断对象是否可回收

2）哪些可以做GCRoots对象

3）JVM的参数类型

4）查看JVM默认值

5）常用的配置参数

6）强软弱虚

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

小菜良记