JVM知识点整理

作者: Suny____ | 来源:发表于2023-03-02 17:04 被阅读0次

JVM知识点整理
JVM知识点整理
JVM知识点整理
刚从京东面试回来，我才知道这些JVM知识有多重要
JVM基础知识系列
JVM 详解（JVM 内存模型、JMM 内存可见性、类加载机制、
一份囊括JVM、Spring、Kafka、多线程等29个Java
阿里架构师近十年时间整理出来的Java核心知识（Java岗位）
阿里架构师花近十年时间整理出来的Java核心知识pdf（Java
「Java面试宝典」强势来袭，为即将到来的金九银十做好充足的准备

1、JVM运行时数据区

image-20230301154314997.png

堆（共享）
- 堆用来存放对象和数组，只要是堆中的对象，就可以被所有线程共享（静态变量、静态常量、字符串存储在堆中的老年代里）
  - Java7 版本中将永久代的静态变量和运行时常量池转移到堆中存放的
- 堆是 JVM 上最大的内存区域。垃圾回收操作的对象就是堆
- 堆空间一般是程序启动时就申请了，一般设置成可伸缩的。随着对象的频繁创建，堆空间占用的越来越多，就需要不定期的对不再使用的对象进行回收，这就是GC
- 对于基本数据类型对象（如byte、short、int、long、float、double、char)，在方法体内声明时，会直接分配在栈中,其它情况都会分配在堆中
- 对于普通对象来说，JVM 会首先在堆上创建对象，然后在其他地方使用它的引用
  - 比如，把这个引用保存在虚拟机栈的局部变量表中。但是在开启了逃逸分析时，如果发现某个对象只会在方法内部使用，则可能会将该对象经过标量替换后也存在栈中
- 堆的几个重要参数
  - -Xms：堆的最小值（初始值，默认单位是：字节，要求是1024的整数倍）
  - -Xmx：堆的最大值
  - -Xmn：新生代的大小
  - -XX:NewSize；新生代最小值（初始值）
  - -XX:MaxNewSize：新生代最大值
方法区（元空间）（共享）
- 方法区存储的内容
  - 类型信息(比如类全称、父类全称)
  - 域信息（域名称、域修饰符private等）
  - 方法信息(方法名称、方法修饰符、返回类型等)
  - 字面量(字面量包括文本字符串、八种基本类型的值、被声明为final的常量等）
- 假如两个线程都试图访问方法区中的同一个类信息，而这个类还没有加载进 JVM，那么此时就只允许一个线程去加载它，另一个线程必须等待
- 方法区是 JVM 对内存的逻辑划分
  - 在 JDK1.7 及之前将方法区称为永久代
  - 在 JDK1.8 及以后使用了元空间来实现方法区
- 元空间大小参数设置：
  - 如果不设置参数，则只受本机总内存的限制
  - jdk1.7 及以前
    - -XX:PermSize
    - -XX:MaxPermSize
  - jdk1.8 以后
    - -XX:MetaspaceSize
    - -XX:MaxMetaspaceSize
本地方法栈
- 如果当前线程执行的方法是Native类型的，这些方法就会在本地方法栈中执行
虚拟机栈（线程私有）
- Java虚拟机栈是当前线程在执行方法时存储所需的数据、指令、返回地址的一种栈结构(先进后出)。它的生命周期与线程保持一致
- 每调用一个方法就会在栈里加入一个栈帧。调用的方法执行完了，对应的栈帧就会出栈
- 栈帧里分为4个区域，这4个区域就包含了执行Java方法时的全部内容
  - 局部变量表
    - 存方法参数和局部变量。如果是引用类型则存的是对象在堆中的地址。第0行，放的就是this
  - 操作数栈
    - 操作数栈也是一个先进后出的栈结构，它用来临时存放即将要操作的数据
  - 动态连接
    - Java 语言特性多态（需要类加载、运行时才能确定具体的方法），如子类重写父类方法后，具体调用哪个要等到执行时才能确定。这时候的符号引用转化为直接引用称为动态链接
  - 方法出口
    - 方法出口其实就是记录的返回地址。例如：方法1调用了方法2之后，那么方法2的出口地址就是方法1调用方法2的代码位置，因为在方法2执行完了之后，要回到方法1继续执行。
    - 正常返回（遇到方法返回的字节码指令）
    - 异常返回（通过异常处理器表<非栈帧中的>来确定），并且这个异常没有在方法体内得到处理
程序计数器（线程私有）
- 由于现在都是多线程运行，而一个CPU在同一时刻只能运行一个线程，多个线程只能交替运行。程序计数器的作用就是记录当前线程下一条要运行的指令，这样保证了线程在切换回来时能回到正确的位置继续开始执行
- 如果正在执行的是Native 方法，由于不是JVM执行，则这个计数器值为空(Undefined)

1.1、堆空间划分

image-20230301160529675.png

一般情况下，新创建的对象都会被分配到Eden区，一些特殊的大的对象会直接分配到Old区
- 大对象直接进入老年代
  - JVM参数-XX:PretenureSizeThreshold 来设置对象大小阈值（字节数）
    - 比如“1048576”，就是1M
- 经过15次GC仍然存活的对象
  - JVM参数 -XX:MaxTenuringThreshold 来设置存活次数，默认15
- 动态对象年龄判断
  - Survivor区域里一批对象的总大小大于了这块Survivor区域的内存大小的50% ，那么此时大于等于这批对象年龄的对象，就可以直接进入老年代了
- Survivor区空间不够
  - GC后Survivor区空间不够存放对象了，这时会吧对象直接转移到老年代
- 老年代空间分配担保规则
对象入堆流程

image-20230301160753966.png

1.2、Java对象内存布局

image-20230301160428185.png

对象头
- Mark Word
  - 包含一系列的标识，例如锁的标记、对象年龄等。在32位系统占4字节，在64位系统中占8字节
- Class Pointer
  - 指向对象所属的 Class 在方法区的内存指针，通常在32位系统占4字节，在64位系统中占8字节，64位 JVM 在 1.6 版本后默认开启了压缩指针，那就占用4个字节
- Length
  - 如果对象是数组，还需要一个保存数组长度的空间，占 4 个字节
Mark Word

image-20230302140421111.png
Monitor
- Java虚拟机给每个对象和class字节码都设置了一个监听器Monitor，用于检测并发代码的重入
- 当多个线程同时请求某个对象监视器时，对象监视器会设置几种状态用来区分请求的线程
  - Contention List：所有请求锁的线程将被首先放置到该竞争队列
  - Entry List：Contention List中那些有资格成为候选人的线程被移到Entry List
  - Wait Set：那些调用wait方法被阻塞的线程被放置到Wait Set
  - OnDeck：任何时刻最多只能有一个线程正在竞争锁，该线程称为OnDeck
  - Owner：获得锁的线程称为Owner
  - !Owner：释放锁的线程

2、垃圾回收（GC）

如何判断垃圾对象
- 可达性分析算法
  - 是以根对象（GCRoots）为起始点，按照从上到下的方式搜索被根对象集合所连接的目标对象是否可达
    - GC Roots包括
      - 本地方法栈内JNI,引用的对象
      - 方法区中静态属性引用的对象
      - 方法区中常量引用的对象
      - 所有被同步锁synchronized持有的对象
      - Java虚拟机内部的引用
  - 使用可达性分析算法后，内存中存活的对象都被被根对象集合直接或间接连接着，搜索所走过的路径称为引用链
  - 如果目标对象没有任何引用链相连，则是不可达的，意味着该对象已经死亡，可以标记为垃圾对象
GC算法
- 标记-清除算法
  - 从引用根节点开始遍历，标记所有被引用的对象，一般是在对象Header中记录为可达对象
  - 对堆内存从头到尾进行线性的遍历，如果发现某个对象在其Header中没有标记为可达对象，则将其回收
- 复制算法
  - 将或者的内存空间分为两块，每次使用其中一块。在垃圾回收时，将正在使用的内存中的存活的对象复制到未被使用的内存块中，之后清除正在使用的内存块中的所有的对象，交换两个内存的角色，最后完成垃圾回收
- 标记-压缩（标记-整理）算法
  - 第一个阶段和标记清除算法一样，从根节点开始标记所有被引用的对象
  - 第二阶段将所有的存活对象压缩在内存的一端，按照顺序排放，之后清理边界外所有的空间
  - 最终效果等同于标记清除算法执行完成后，再进行一次内存碎片整理
  - 与标记清除算法本质区别，标记清除算法是非移动式的算法，标记压缩是移动式的
- 分代收集算法
  - 不同生命周期的对象可以采取不同的收集方式，以便提高回收效率，几乎所有的GC都采用分代收集算法执行垃圾回收的
  - 年轻代
    - 生命周期短，存活率低，回收频繁
    - 采用Serial、ParNew、Parallel Scavenge回收算法
  - 老年代
    - 区域较大，生命周期长，存活率高，回收不及年轻代频繁
    - 采用Serial Old、Parallel Old GC、CMS 回收算法
- 增量收集算法
  - 每次垃圾收集线程只收集一小片区域的内存空间，接着切换到应用程序线程，依次反复，直到垃圾收集完成
  - 通过对线程间冲突的妥善管理，允许垃圾收集线程以分阶段的方式完成标记、清理或复制工作
- 分区算法
  - 为了控制GC产生的停顿时间，将一块大的内存区域分割成多个小块，根据目标的停顿时间，每次合理的回收若干个小区间，而不是整个堆空间，从而减少一次GC所需时间
  - 分代算法是将对象按照生命周期长短划分为两个部分，分区算法是将整个堆划分为连续的不同的小区间
  - 每一个小区间都独立使用，独立回收，这种算法的好处是可以控制一次回收多少个小区间
Serial回收器（串行回收）
- Serial收集器采用复制算法，串行回收和STW机制的方式执行内存回收
ParNew回收器（并行回收）
- 除了采用并行回收，其他方面和Serial之间几乎没有任何区别
- 年轻代使用，不影响老年代
CMS回收器（低延迟）
- CMS(Concurrent Mark Sweep)收集器是一种以获取 最短回收停顿时间 为目标的收集器
- 采用的是标记-清除算法 整个过程分为4步
  - 初始标记
    - 标记GC Roots能关联到的对象，需要Stop The World
  - 并发标记
    - 进行GC Roots Tracing
  - 重新标记
    - 修改并发标记因用户程序变动的内容，需要Stop The World
  - 并发清除
- 由于整个过程中，并发标记和并发清除，收集器线程可以与用户线程一起工作，所以总体上来
  
  说，CMS收集器的内存回收过程是与用户线程一起并发地执行的
- 由于在垃圾收集阶段用户线程没有中断，所以在CMS回收过程中，还应该确保应用程序用户线程有足够的内存可用。因此CMS收集器不能像其他收集器那样等到老年代几乎填满再进行回收，而是当堆内存使用率达到某一阈值时，便开始进行回收
- CMS采取标记清除算法，会产生内存碎片，只能够选择空闲列表执行内存分配
G1回收器
- Java堆的内存布局与就与其他收集器有很大差别，它将整个Java堆划分为多个大小相等的独立区域（Region），虽然还保留有新生代和老年代的概念，但新生代和老年代不再是物理隔离的了，它们都是一部分Region（不需要连续）的集合
- 使用不同的region表示Eden，s0，s1，老年代等，G1跟踪各个region里面垃圾堆积的价值大小，在后台维护一个优先列表，每次根据允许的收集时间，优先回收价值最大的Region
- 优势
  - 并行与并发
  - 同时兼顾年轻代与老年代
  - 空间整合
    - region之间用复制算法，整体可以看做是标记压缩算法。
    - 两种算法都避免内存碎片，有利于程序长时间运行，分配大对象不会因为无法找到连续空间提前触发下一次GC，尤其当Java堆非常大的时候，G1优势更加明显
  - 可预测的停顿时间模型
    - 能让使用者明确指定在一个长度为M毫秒的时间片段内，消耗在垃圾收集上的时间不能超过N毫秒
- Region
  - region可以充当多个角色，所有region大小相同，且在JVM生命周期内不会改变
  - 一个region可能属于Eden、survivor或Old内存区域。但是一个region只能属于一个角色
  - G1还增加了一个新的内存区域：humongous，主要用于存储大对象，如果超过1.5个region，就放到humongous中
- 工作过程可以分为如下几步
  - 初始标记
    - 标记一下GC Roots能够关联的对象，并且修改TAMS的值，需要Stop The World
  - 并发标记
    - 从GC Roots进行可达性分析，找出存活的对象，与用户线程并发执行
  - 最终标记
    - 修正在并发标记阶段因为用户程序的并发执行导致变动的数据，需要Stop The World
  - 筛选回收
    - 对各个Region的回收价值和成本进行排序，根据用户所期望的GC停顿时间制定回收计划

3、什么是JMM

JMM就是Java内存模型(java memory model)。JMM 是建立在硬件内存模型基础上的抽象模型，因为在不同的硬件生产商和不同的操作系统下，内存的访问有一定的差异，所以JMM屏蔽掉各种硬件和操作系统的内存访问差异，以实现让java程序在各种平台下都能达到一致的并发效果
JMM抽象结构划分为线程本地缓存与主存，每个线程均有自己的本地缓存，本地缓存是线程私有的，主存则是计算机内存，它是共享的

932dc2d271410523a126591b8268cb74.png

JMM内存模型规则
- 我们所有定义的变量(除局部变量)都存放在主内存(Main Memory)
- 每个线程都有自己的工作内存，工作内存中存放需要使用的变量的主内存副本
- 线程对所有变量的操作都必须在工作内存中进行。不能直接在主内存中操作
- 不同线程之间无法直接访问对方工作内存中的变量。线程间变量值的传递需要通过主内存进行传递
保证并发的三大特性
- 可见性
  - 当一个线程修改了共享变量的值，其他线程能够立即得知这个修改，这就是可见性，如果无法保证，就会出现缓存一致性的问题
  - JMM规定，所有的变量都放在主存中，当线程使用变量时，先从缓存中获取，缓存未命中，再从主存复制到缓存，最终导致线程操作的都是自己缓存中的变量
  - Java是利用volatile关键字来提供可见性的。当变量被volatile修饰时，这个变量被修改后会立刻刷新到主内存，并失效其他线程的缓存，当其它线程需要读取该变量时，会去主内存中读取新值
- 原子性
  - 原子性是指一个或者多个操作在CPU执行的过程中不被中断的特性，一个线程在执行时不会被其他线程干扰
  - Java中提供了synchronized（同时满足有序性、原子性、可见性）可以保证结果的原子性
- 有序性
  - 编译器和处理器为了优化性能，会对代码做重排，所以语句实际执行的先后顺序与输入的代码顺序可能一致，这就是指令重排序
  - 为解决重排序，使用Java提供的volatile修饰变量同时保证可见性、有序性，被volatile修饰的变量会加上内存屏障禁止排序

特性	volatile	synchronized	Lock	Atomic
可见性	可以保证	可以保证	可以保证	可以保证
原子性	无法保证	可以保证	可以保证	可以保证
有序性	一定程度保证	可以保证	可以保证	无法保证

JVM知识点整理
一、JVM是什么 JVM就是Java虚拟机（Java Virtual Machine），简单来说，JVM消除了开发...
JVM知识点整理
JVM知识点整理
1、JVM运行时数据区堆（共享）堆用来存放对象和数组，只要是堆中的对象，就可以被所有线程共享（静态变量、静态常量...
刚从京东面试回来，我才知道这些JVM知识有多重要
面试题关于JVM的知识之前也写过相关的文章整理，但是从京东面试后，才发现这些JVM的知识点尤为重要，所以特意整理...
JVM基础知识系列
JVM基础系列 JVM知识点扫盲系列（1） JVM知识点扫盲系列（2） JVM内存的那些事 JVM类加载的那些事 ...
JVM 详解（JVM 内存模型、JMM 内存可见性、类加载机制、
JVM 知识点汇总首先看看 JVM 的知识点汇总。如上图所示，JVM 知识点有 6 个大方向，其中，内存模型、...
一份囊括JVM、Spring、Kafka、多线程等29个Java
【Java核心知识点整理】覆盖了JVM、锁、高并发、反射、Spring原理、微服务、Zookeeper、数据库、数...
阿里架构师近十年时间整理出来的Java核心知识（Java岗位）
整理了一份Java核心知识点。覆盖了JVM、锁、并发、Java反射、Spring原理、微服务、Zookeeper、...
阿里架构师花近十年时间整理出来的Java核心知识pdf（Java
整理了一份Java核心知识点。覆盖了JVM、锁、并发、Java反射、Spring原理、微服务、Zookeeper、...
「Java面试宝典」强势来袭，为即将到来的金九银十做好充足的准备
前言 Java面试宝典【Java核心知识点整理】覆盖了JVM、锁、高并发、反射、Spring原理、微服务、Zook...