美文网首页
5.JVM层GC调优

5.JVM层GC调优

作者: 心释逍遥lx | 来源:发表于2020-03-15 12:08 被阅读0次

    JVM与调优 imooc JVM Markdown

    JVM的内存结构

    运行时数据区

    方法区          (共享)
    堆              (共享)
    虚拟机栈         (私有)
    本地方法栈       (私有)
    程序计数器(PC)  (私有)
    

    程序计数器PC Register
    JVM支持多线程同时运行,每个线程有自己的PC Register,线程正在执行的方法叫做当前方法,如果是java代码,PC Register里面存放的就是当前正在执行的指令的地址。如果是C代码,则为空。

    虚拟机栈JVM Stacks
    Java虚拟机栈(Java Virtual Machine Stacks) 是线程私有的,生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧,用于存储局部变量表操作数栈动态链接方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。

    堆Heap
    Java堆是Java虚拟机所管理的内存中最大的一块。堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象示例,几乎所有的对象实例都在这里分配内存
    Java堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。
    堆的优势是可以在运行时动态地分配内存空间,不必事先告诉编译器。

    方法区Method Area
    方法区与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。虽然Java虚拟机规范把方法区描述为堆的一个逻辑部分,但是它却有一个别名叫做Non-Heap(非堆),目的是与Java堆区分开来。对应于jdk1.8 的MetaSpace。

    tips: 常量池Run-Time Constant Pool
    运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(Constant Pool Table),用于存放编译器生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。

    本地方法栈Native Method Stacks
    本地方法栈(Native Method Stack)与虚拟机栈所发挥的作用是非常相似的,它们之间的区别不过是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务

    非堆区: 是操作系统的本地内存,独立于JVM之外的
    Metaspace= Class、Package、Method、Field、字节码、常量池、符号引用等等
    CCS: 32位指针的Class
    CodeCache: JIT编译后的本地代码、JNI使用的C代码

    常用参数

    -Xms  -Xmx
    -XX:NewSize -XX:MaxNewSize (新生代的大小/最大的大小)
    -XX:NewRatio(New区和Old区比例) -XX:SurvivorRatio (Eden区和Survivor区比例)
    -XX:MetaspaceSize -XX:MaxMetaspaceSize (指定Metaspace大小)    
    -XX:+UseCompressedClassPointers(是否启用压缩的类指针)
    -XX:CompressedClassSpaceSize(设置压缩类指针的内存大小,默认1G)
    -XX:InitialCodeCacheSize    
    -XX:ReservedCodeCacheSize
    

    常用垃圾回收算法

    思想:枚举根节点,做可达性分析
    根节点:类加载器、Thread、虚拟机栈的本地变量表、static成员、常量引用、本地方法栈的变量等等。

    标记清除算法

    • 算法思想
      算法分为”标记“和”清除”两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有。
    • 缺点
      效率不高。标记和清除两个过程效率都不高。容易产生碎片(可能不连续),碎片太多会导致提前GC。

    复制

    • 算法思想
      它将可用内存按容量划分位大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的对象复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。(Survivor1 和Survivor2就是采用复制算法
    • 优缺点
      实现简单,运行搞笑,但是空间利用率低。

    标记整理

    • 算法思想
      标记过程仍然与“标记-清除” 算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存
    • 优缺点
      没有了内存碎片。但是整理内存比较耗时。

    分代垃圾回收

    Young区用复制算法
    Old区用标记清除或者标记整理

    对象分配

    对象优先在Eden区分配
    大对象直接进入老年代:-XX:PretenureSizeThreshold (通过这个参数),超过这个参数的值,进入老年代
    长期存活对象进入老年代:-XX:MaxTenuringThreshold -XX:+PrintTenuringDistribution -XX:TargetSuivivorRatio

    垃圾收集器

    串行收集器Serial:Serial、Serial Old
    并行收集器Parallel:Parallel Scavenge、Parallel Old、(吞吐量优先)    
    并发收集器Concurrent:CMS、G1、(停顿时间优先)
    

    tips: 并行 vs 并发

    并行(Parallel):指多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。适合科学计算、后台处理等弱交互场景。
    并发(Concurrent):指用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),垃圾收集线程在执行的时候不会停顿用户程序的运行。适合对响应时间有要求的场景,比如Web。

    tips: 停顿时间 vs 吞吐量

    停顿时间:垃圾收集器做垃圾回收中断应用执行的时间。-XX:MaxGCPauseMillis
    吞吐量:花在垃圾收集的时间和花在应用时间的占比。-XX:GCTimeRatio=<n>,垃圾收集时间占比:1/1+n。

    串行收集器

    -XX:+UseSerialGC
    -XX:+UseSerialOldGC

    并行收集器

    吞吐量优先
    -XX:+UseParallelGC、-XX:+UseParallelOldGC
    Server模式下的默认收集器(总共client、server两种,默认超过2G,会启动Server)

    并发收集器

    响应时间优先
    CMS:-XX:+UseConcMarkSweepGC (old区方式) -XX:+UseParNewGC (young区方式)
    G1: -XX:+UseG1GC

    垃圾收集器搭配

    image.png

    只有有连线就可以搭配使用,java8推荐使用G1(Young区、Old区都可以使用)

    如何选择垃圾收集器

    • 优先调整堆的大小让服务器自己来选择
    • 如果内存小于100M,使用串行收集器
    • 如果是单核,并且没有停顿时间的要求,串行或者JVM自己选
    • 如果允许停顿时间超过1秒,选择并行或者JVM自己选
    • 如果响应时间最重要,并且不能超过1秒,使用并发收集器

    Parallel Collector

    -XX:+UseParallelGC 手动开启,Server默认开启
    -XX:ParallelGCThreads=<N> 多少个GC线程
    CPU > 8 N = 5 / 8
    CPU < 8N = CPU

    Parallel Collector Ergonomics(自适应)

    -XX:MaxGCPauseMillis=<N>
    -XX:GCTimeRatio=<N>
    -Xmx<N>
    Ergonomics 方式需要动态调整每个区的条件,性能不是最好。

    动态内存调整

    -XX:YoungGenerationSizeIncrement=<Y> 默认20%
    -XX:TenuredGenerationSizeIncrement=<T> 默认20%
    -XX:AdaptiveSizeDecrementScaleFactor=<D> 默认4%
    使用比较少。

    CMS Collector

    • 并发收集
    • 低停顿 低延迟
    • 老年代收集器

    CMS垃圾收集过程

    1. CMS initial mark :初始标记Root,STW
    2. CMS Concurrent mark: 并发标记
    3. CMS-concurrent-preclean: 并发预清理
    4. CMS remark: 重新标记,STW
    5. CMS concurrent-sweep:并发清除
    6. CMS-concurrent-reset:并发重置

    CMS的缺点

    CPU敏感(GC与应用一起使用)
    浮动垃圾
    空间碎片

    CMS的相关参数

    -XX:ConcGCThreads: 并发的GC线程数
    -XX:+UseCMSCompactAtFullCollection: FullGC之后做压缩
    -XX:CMSFullGCsBeforeCompaction: 多少次FullGC之后压缩一次
    -XX:CMSInitiatingOccupancyFraction: 触发FullGC (默认92%old区垃圾)
    -XX:+UseCMSInitiatingOccupancyOnly:是否动态调
    -XX:+CMSScavengeBeforeRemark: FullGC之前先做YGC(调优参数,通常会打开)
    -XX:+CMSClassUnloadingEnabled: 启用回收Perm区(1.7之前)

    iCMS (增量的CMS)

    适用于单核或双核(1.8已经废弃)

    G1 Collector (1.8主流、1.9默认,并将CMS过时)

    The Garbage-First (G1) collector is a server-style garbage collector, targeted for multi-processor machines with large memories. It meets garbage collection (GC) pause time goals with a high probability, while achieving high throughput. The G1 garbage collector is fully supported in Oracle JDK 7 update 4 and later releases. This means heap sizes of around 6GB or larger,and a stable and predictable pause time below 0.5 seconds.

    新生代和老生代收集器

    G1的几个概念

    Region
    SATB: Snapshot-At-The-Begining,它是通过Root Tracing得到的,GC开始时候存活对象的快照。
    RSet:记录了其他Region中的对象引用本Region中对象的关系,属于points-into结构(谁引用了我的对象)

    YoungGC

    新对象进入Eden区
    存活对象拷贝到Survivor区
    存活时间达到年龄阈值时,对象晋升到Old区
    以上 阶段和通常的GC收集器一致

    MixedGC

    不是FullGC,回收所有的Young和部分Old
    global concurrent marking

    global concurrent marking

    1. Initial marking phase: 标记GC Root,STW
    2. Root region scanning phase: 标记存活Region
    3. Concurrent marking phase: 标记存活的对象
    4. Remark phase: 重新标记,STW
    5. Cleanup phase:部分STW

    MixedGC时机

    • InitiatingHeapOccupancyPercent:
      堆占用率达到这个数值则触发global concurrent marking,默认45%

    • G1HeapWastePercent:
      在global concurrent marking结束之后,可以知道区有多少空间要被回收,在每次YGC之后和再次发生Mixed GC之前,会检查垃圾占比是否达到此参数,只有达到了,下次才会发生Mixed GC。

    MixedGC相关参数

    G1MixedGCLiveThresholdPercent:Old区的region被回收时候的存活对象占比
    G1MixedGCCountTarget:一次global concurrent marking之后,最多执行Mixed GC的次数。
    G1OldCSetRegionThreshodPercent:一次Mixed GC中能被选入CSet的最多old区的region数量
    -XX:+UseG1GC: 开启G1
    -XX:G1HeapRegionSize=n: region的大小,1-32M,2048个
    -XX:MaxGCPauseMillis=200:最大停顿时间
    -XX:G1NewSizePervent、-XX:G1MaxNewSizePercent
    -XX:G1ReservePercent=10: 保留防止to space溢出
    -XX:ParallelGCThreads=n: STW线程数
    -XX:ConcGCThreads=n:并发线程数=1/4*并行

    G1最佳实践

    • 年轻代大小: 避免使用-Xmn、-XX:NewRatio等显式设置Young区大小,会覆盖暂停时间目标。
    • 暂停时间目标:暂停时间不要太严苛,其吞吐量目标是90%的应用程序时间和10%的垃圾回收时间,太严苛会直接影响到吞吐量。
    • 关于MixedGC调优:
      -XX:InitiatingHeapOccupancyPercent
      -XX:G1MixedGCLiveThresholdPercent、-XX:G1HeapWastePercent
      -XX:G1MixedGCCountTarget
      -XX:G1OldCSetRegionThresholdPercent

    切换到G1的场景

    50%以上的堆被存活对象占用
    对象分配和晋升的速度变化非常大
    垃圾回收时间特别长,超过了1秒

    可视化GC日志工具

    1. 在线工具:http://gceasy.io/
    2. GCViewer

    打印日志相关参数

    -XX:+PrintGCDetails -XX:+PrintGCTimeStamps
    -XX:+PrintGCDateStamps
    -Xloggc:$CATALINA_HOME/logs/gc.log
    -XX:+PrintHeapAtGC
    -XX:+PrintTenuringDistribution

    ParallelGC调优

    初始设置

    -XX:+DisableExplicitGC (禁用明确GC)
    -XX:+HeapDumpOnOutOfMemoryError
    -XX:+HeapDumpPath=CATALINA_HOME/logs/ -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDataStamps -Xloggc:CATALINA_HOME/logs/gc.log

    Parallel GC调优的指导原则

    1. 除非确定,否则不要设置最大堆内存
    2. 优先设置吞吐量目标
    3. 如果吞吐量目标达不到,调大最大内存,不能让OS使用Swap,如果仍然达不到,降低目标。
    4. 吞吐量能达到,GC时间太长,设置停顿时间的目标。

    ParallelGC调优(参考)

    • 设置Metaspace大小
      -XX:MetaspaceSize=64M -XX:MaxMetaspaceSize=64M

    • 添加吞吐量和停顿时间参数
      -XX:GCTimeRatio=99 -XX:MaxGCPauseMillis=100

    • 修改动态扩容增量
      -XX:YoungGenerationSizeIncrement=30

    G1 GC调优

    G1调优相关参数

    -XX:+UseG1GC
    -Xms128M
    -Xmx128M
    -XX:MetaspaceSize=64M
    -XX:MaxGCPauseMillis=100
    -XX:+UseStringDeduplication
    -XX:StringDeduplicationAgeThreshold=3

    相关文章

      网友评论

          本文标题:5.JVM层GC调优

          本文链接:https://www.haomeiwen.com/subject/chncehtx.html