JVM问题排查小工具

作者: miaoLoveCode | 来源:发表于2018-02-02 21:01 被阅读658次

注:最近一直想出一篇介绍JVM底层函数调用的博客,奈何越写越多,现在还没写完,先来个简单的安慰下我受伤的心灵

滴滴...报警短信又来了~~~打开一看,xxx系统内存使用率达90%,请尽快处理。一脸懵逼,昨天还60%,今天怎么就90%了,内存泄漏了么?

相信这个场景绝大多数猿都不陌生,出现这个问题了我们该怎么办呢?Java的内存分配和垃圾收集都对开发者不透明,我们要怎么排查这类型的问题呢?接下来,就让我,来给你们介绍几款排查JVM问题的小工具。

JDK提供的命令工具

作为一个Java程序猿,大家肯定都知道jdk的bin目录下有javajavac这俩命令,但是bin下其实还有好多其他的命令,我相信并不是所有的程序猿都非常了解这些命令。这次我要介绍排查JVM问题的小工具呢也就在bin目录下。先来看下bin目录下的命令集们:

bin目录下命令集
这些可爱的命令集们是java开发者们送给JDK使用者们的小礼物,它们可以帮助我们快速在遇到JVM问题可以快速排查并定位bug。

注:bin目录下的命令集们体积都很小,体积小并不是java开发者们在炫耀技术,而是这些命令其实大多都是包装jdk/lib/tools.jar,至于为什么选择用java来实现这些命令也是为了便于在应用程序中直接实现JVM的监控和分析。

排查JVM问题命令工具

JDK提供以下命令排查JVM问题:

  • jps:JVM Process Status Tool,显示系统内所有的JVM进程;

  • jstat:JVM Statistics Monitoring Tool,可以收集JVM相关的运行数据;

  • jinfo:Configuration Info for Java,显示JVM配置信息;

  • jmap:Memory Map for Java,用于生成JVM的内存快照;

  • jhat:JVM Heap Dump Browser,用于分析heapdump文件,它可以建立一个http/html服务,使用者可以在浏览器上查看分析结果;

  • jstack:Stack Trace for Java,显示JVM的线程快照。

接下来就针对这几个命令的使用做相关分析。

jps

列出正在运行的虚拟机进程,并显示虚拟机执行主类名称以及这些进程的本地虚拟机唯一id(Local Virtual Machine Identifier,简称LVMID)。相比其他命令来说,它的功能其实比较单一,但是它的使用频率确实非常高的,因为其他的JDK命令大多都需要输入虚拟机进程id。

注:看到这里小伙伴们可能就会比较困惑了,因为在大多数使用JDK命令时,我们都用的是pid(操作系统进程id)啊,那pid和LVMID到底有什么区别呢?其实,很负责任的告诉你,对于本地虚拟机进程来说,它俩无差别,用ps命令也可以查询到,但是如果同时启动多个虚拟机进程无法根据进程名称定位时,jps命令就派上用场了,可以输出主类名称,通过主类名称来区分。

jps命令格式:

jps命令格式

jps主要提供以下选项:

  • -q
    只输出LVMID,省略主类名称;

  • -m
    输出虚拟机进程启动时传给主类函数的参数;

  • -l
    输出主类的完成package名称或者jar包完整路径名;

  • -v
    输出虚拟机启动时的JVM参数

接下来我们来看看它的实际使用:

  • 测试代码: 测试代码
  • 使用结果: jps使用结果
jstat

用于监控虚拟机运行状态信息。它可以显示本地或者远程虚拟机进程的内存、垃圾收集、JIT编译等运行数据。

jstat命令格式:

jstat命令格式
jstat命令稍许有些复杂,它主要有以下参数:
  1. option:选项,jstat主要提供以下选项:

    • -class
      监视类的装载/卸载数量、总空间以及类装载所耗时间;

    • -gc
      监视java heap情况,包括eden区和两个survivor区、old区、永久区等的容量,已用空间和GC时间等信息;

    • -gccapacity
      监视内容与-gc基本是一致的,-gccapacity的输出包括heap各个区域使用到的最大最小空间;

    • gcutil
      监视内容同样与-gc基本一致,-gcutil的输出主要是heap各个区域使用空间占总空间百分比;

    • gccause
      -gcutil功能一致,但是会额外输出导致上一次gc的原因;

    • gcnew
      监视young区gc情况;

    • gcnewcapacity
      监视内容与-gcnew基本相同,-gcnewcapacity的输出包括使用到的最大最小空间;

    • -gcold
      监视old区gc情况;

    • -gcoldcapacity
      监视内容与-gcold基本相同,-gcoldcapacity的输出包括使用到的最大最小空间;

    • -gcpermcapacity
      输出永久代使用到的最大最小空间;

    注:JDK 8废除了永久代,引入了Metaspace,这个命令在JDK 8的环境下就不能使用了,那要看元数据空间相关情况,使用-gcmetacapacity即可

    • -compiler
      输出JIT编译器编译过的方法以及耗时等信息;
    • -printcompilation
      输出以及被JIT编译的方法
  2. vmid:虚拟机进程id,这时候小伙伴们肯定又要开始疑惑了,这个vmid与lvmid又有什么区别?其实对于本地虚拟机进程,它俩没任何区别,但是如果是远程虚拟机进程,它俩就有区别了,远程虚拟机进程vmid格式应该是这样:
    [protocol:][//] lvmid [@hostname[:port]/servername]

  3. interval:查询时间间隔;

  4. count:查询次数。

注:如果参数interval和count省略则代表只查询一次;如果count省略的话,就会一直查询。来个简单的例子:jstat -gcnewcapacity 41503 1000,表示输出进程41503的young区使用及gc情况,每1000ms输出一次

接下来就部分option给出实例,同时分析下输出。

jstat使用

  1. jstat -class <vmid>


    jstat -class输出
    • Loaded:装载的类的数量;

    • Bytes:装载类所占用的字节数;

    • Unloaded:卸载类数量;

    • Bytes:卸载类所占用的字节数;

    • Time:装载和卸载类所花时间。

  2. jstat -compiler <vmid>


    jstat -compiler输出
    • Compiled:编译任务执行数量;

    • Failed:编译任务执行失败数量;

    • Invalid:编译任务执行失效数量;

    • Time:编译任务消耗时间;

    • FailedType:最后一个编译失败任务的类型;

    • FailedMethod:最后一个编译失败任务所在的类及方法。

  3. jstat -gc <vmid>


    jstat -gc输出
    • S0C:young区中的第一个survivor区的大小;

    • S1C:young区中的第二个survivor区的大小;

    • S0U:young区中的第一个survivor区目前已使用空间;

    • S1U:young区中的第二个survivor区目前已使用空间;

    • EC:young区中的eden区的大小;

    • EU:young区中的eden区目前已使用空间;

    • OC:old区的大小;

    • OU:old区目前已使用空间;

    • MC:元数据区大小;

    • MU:元数据区使用大小;

    • CCSC:压缩类空间大小;

    • CCSU:压缩类空间使用大小;

    • YGC:young gc次数;

    • YGCT:young gc消耗时间;

    • FGC:full gc次数;

    • FGCT:full gc消耗时间;

    • GCT:gc消耗时间。

  4. jstat -gcutil <vmid>


    jstat -gcutil输出
    • S0:young区中的第一个survivor区的使用比例;

    • S1:young区中的第二个survivor区的使用比例;

    • E:young区中的eden区的使用比例;

    • O:old区使用比例;

    • M:元数据区使用比例;

    • CCS:压缩类空间使用比例;

    • YGC:young gc次数;

    • YGCT:young gc消耗时间;

    • FGC:full gc次数;

    • FGCT:full gc消耗时间;

    • GCT:gc消耗时间。

  5. jstat -gccapacity <vmid>


    jstat -gccapacity输出
    • NGCMN:young区最小容量;

    • NGCMX:young区最大容量;

    • NGC:当前young区容量;

    • S0C:young区中的第一个survivor区的大小;

    • S1C:young区中的第二个survivor区的大小;

    • EC:young区中的eden区的大小;

    • OGCMN:old区最小容量;

    • OGCMX:old区最大容量;

    • OGC:当前old区大小;

    • OC:当前old区的大小;

    • MCMN:元数据区最小容量;

    • MCMX:元数据区最大容量;

    • MC:当前元数据区大小;

    • CCSMN:压缩类空间最小容量;

    • CCSMX:压缩类空间最大容量;

    • CCSC:当前压缩类空间大小;

    • YGC:young gc次数;

    • FGC:old gc次数。

  6. jstat -gcnew <vmid>


    jstat -gcnew输出
    • S0C:young区中的第一个survivor区的大小;

    • S1C:young区中的第二个survivor区的大小;

    • S0U:young区中的第一个survivor区目前已使用空间;

    • S1U:young区中的第二个survivor区目前已使用空间;

    • TT:对象在young区存活的次数;

    • MTT:对象在young区存活的最大次数;

    • DSS:期望survivor区大小;

    • EC:young区中的eden区的大小;

    • EU:young区中的eden区目前已使用空间;

    • YGC:young gc次数;

    • YGCT:young gc消耗时间。

  7. jstat -gcold <vmid>


    jstat -gcold输出
    • MC:元数据空间大小;

    • MU:元数据空间使用大小;

    • CCSC:压缩类空间大小;

    • CCSU:压缩类空间使用大小;

    • OC:old区大小;

    • OU:old区使用大小;

    • YGC:young gc次数;

    • FGC:full gc次数;

    • FGCT:full gc消耗时间;

    • GCT:gc消耗时间。

  8. jstat -gcmetacapacity <vmid>


    jstat -gcmetacapacity输出
    • MCMN:元数据区最小容量;

    • MCMX:元数据区最大容量;

    • MC:元数据区大小;

    • CCSMN:压缩类空间最小容量;

    • CCSMX:压缩类空间最大容量;

    • CCSC:压缩类空间大小;

    • YGC:young gc次数;

    • FGC:full gc次数;

    • FGCT:full gc消耗时间;

    • GCT:gc消耗时间。

  1. jstat -printcompilation <vmid>


    jstat -printcompilation输出
    • Compiled:编译方法数量;

    • Size:编译方法的字节码数量;

    • Type:编译方法的编译类型;

    • Method:方法名称。

针对young区和old区相关capacity命令在这里就不做详细分析了,有兴趣的小伙伴自行敲一敲命令运行下,至于输出的表格列含义在前几个命令详细介绍中基本上都包括在内了。

注:在使用jstat命令输出的容量的单位是字节。

jinfo

用于实时查看和调整虚拟机参数。

jinfo命令格式

jinfo命令格式
jinfo命令主要有以下参数:
  1. option:选项,jinfo主要提供以下选项:

    • -flag <name>
      输出指定JVM参数值;

    • -flag [+|-]<name>
      启用或禁用指定JVM参数;

    • -flag <name>=<value>
      设置指定JVM参数值;

    • -flags
      输出所有JVM参数

    • -sysprops
      输出Java系统属性;

    • <no option>
      不指定选项则输出所有的虚拟机参数和Java系统属性

  2. pid:需要查看或者调整虚拟机参数的进程id

接下来我们来看看它的实际使用:


jinfo使用结果
jmap

用于生成堆内存快照(heapdump或者dump文件)。当然,如果不想使用jmap命令,也可以使用JVM参数来生成:

  • -XX:+HeapDumpOnOutOfMemoryError,如果虚拟机在出现OutOfMemory异常后生成dump文件;

  • -XX:+HeapDumpOnCtrlBreak,使用ctrl + break键让虚拟机生成dump文件。

当然,还有一种更暴力的方式就是在linux系统下,kill -3也可以让虚拟机生成dump文件。

jmap命令格式

jmap命令格式
相比jstat命令,jmap命令明显就简单的多了,就两个参数:
  1. option:选项,jmap主要提供以下选项:

    • -dump
      生成Java堆内存快照,使用格式为:-dump:[live, ]format=b,file=<filename>,使用hprof二进制形式,输出jvm的heap内容到文件<filename>,live子参数是可选的,如果指定live选项,就只dump出存活的对象;

    • finalizerinfo
      显示在F-Queue中等待Finalizer线程执行finalize方法的对象;

    • -heap
      显示heap详细信息,比如使用哪种回收器、参数配置、分代状态等;

    • histo
      显示每个class的实例数目,内存占用,类全名信息。VM的内部类名字开头会加上前缀“*”.,如果带上live子参数,则只统计活的对象数量;

    • -permstat
      以ClassLoader为统计口径显示永久代内存状态,需要注意的是,JDK 8将该option替换成了-clstats

    • -F
      强制生成dump文件,当虚拟机进程对-dump选项没有响应时可以使用。

  2. pid:需要生成dump文件的进程id

dump文件在这里我就不做演示了,给一个简单的使用吧:


jmap -histo输出

从输出的结果可以清晰的看出每一个class的实例数目以及内存占用情况。

jstack

用户生成虚拟机当前时刻的线程快照(threaddump/javacore文件)。线程快照就是当前虚拟机内每一条线程正在执行的方法堆栈集合,生成线程快照的目的也就是为了定位线程出现长时间卡顿的原因。

jstack命令格式

jstack命令格式
跟jmap命令一样,jstack命令也只有两个参数:
  1. option:选项,jstack主要提供以下选项:

    • -F
      当线程出现长时间卡顿的时候,强制输出线程堆栈;

    • -l
      除堆栈外,显示关于锁的附加信息;

    • -m
      如果调用JNI方法,可以显示C/C++的堆栈。

  2. pid:需要生成threaddump的进程id。

简单给一个使用吧还是:


jstack -l输出

从输出结果可以清晰的看到线程堆栈以及锁相关信息。具体的怎么根据threaddump分析定位问题最近暂时没有遇到,等遇到了再出文详细介绍啦~

jhat

与jmap命令搭配使用,分析jmap生成的dump文件。jhat内置一个微型的HTTP/HTML服务器,生成dump文件的分析结果后,可以在浏览器中进行查看。其实这个命令在实际生产中使用比较少,为什么不用的原因我总结下来大概有两点:第一呢,线上生产环境怎么可能允许你在线上机器直接分析dump文件啊~~~第二就是jhat的分析功能相比其他工具简直是太简陋了。

它的使用也很简单啊,jhat <dump文件名称>,等分析完就打开浏览器访问相应的地址+端口就可以愉快的开始分析dump文件了。我在这里就不再做详细使用实例分析啦,有兴趣的小伙伴们请自行尝试~

写在最后面

本文只是粗糙的介绍了怎么使用命令排查JVM问题,但是小伙伴们一定不要以为会命令就会排查了,一定要亲自撸起袖子查几轮问题才能熟练理解掌握,当然我也会在后续出一些我排查线上问题的小文章啦~欢迎大家持续关注呀。

相关文章

  • JVM问题排查小工具

    注:最近一直想出一篇介绍JVM底层函数调用的博客,奈何越写越多,现在还没写完,先来个简单的安慰下我受伤的心灵 滴滴...

  • 一次完整的JVM堆外内存泄漏故障排查记录

    前言 记录一次线上JVM堆外内存泄漏问题的排查过程与思路,其中夹带一些JVM内存分配机制以及常用的JVM问题排查指...

  • JVM 问题排查

    CPU使用率高 找出使用率高的进程的pid 找出使用率高的线程tpid 查看使用率高的线程当前在干什么 GC问题 ...

  • JVM问题排查

    一、线上CPU飚高、死锁等排查基本步骤: 1、top 记录CPU使用率最高的JAVA进程PID 2、top -H...

  • JVM问题排查

    一、JVM的参数类型 1.Boolean类型 格式:-XX:[+-]表示启用或者禁用name属性。比如...

  • jvm问题排查

    写在前面 线上系统中:如果突然运行缓慢,CPU 100%,以及Full GC次数过多的问题,最终导致的直观现象就是...

  • JVM问题排查实战系列

    JVM问题排查实战 记一次频繁FGC的简单排查 一次JVM GC长暂停的排查过程 如何使用MAT进行内存泄露分析

  • JVM问题常用排查命令

    JVM问题常用排查命令 @Date 2017.05.23 JVM调优问题 CPU使用率与Load值偏大 : Thr...

  • 记一次OOM查询处理过程

    问题的爆出及分析排查现场 排查后的解决方案 项目的jvm参数 总结 一、问题的爆出及分析排查现场 服务偶尔会出现不...

  • JVM GC问题排查

    线上发生MQ消费延时报警,看业务log发现有几秒钟一行日志都没有,,参考历史情况这种情况不可能出现(发生报警是在业...

网友评论

本文标题:JVM问题排查小工具

本文链接:https://www.haomeiwen.com/subject/ypxjzxtx.html