Linux下机器负载过高排查
1,怎么判断机器负载过高?
top命令,第一行显示load average,有3个值,分别表示1分钟、5分钟、15分钟的平均值,考察这几个值与cpu核数的比值,在小于1的情况下,可以认为负载不高,当大于1时,就可以认为负载过高了。
查看cpu核数:cat /proc/cpuinfo |grep 'model name'
2,怎么排查?
top命令下面会显示各个进程所占资源的情况,找出需要排查的java进程,然后用jdk自带的jstack命令把该进程的堆栈信息打印出来:jstack 进程号 > jstack.txt
3,定位堆栈信息
打开jstack.txt,发现里面堆栈信息太多,无法定位到底是哪一块引起的负载高,这时候就需要判断是哪一个线程负载最高,怎么找到负载高的线程?这就要用到:top -Hp 进程号,这样就会把该进程下的所有线程占用资源都打印出来,这时pid其实就是线程号,把这个pid转化为十六进制,然后去jstack.txt里面查找,就能定位具体的堆栈信息。
4,如果堆栈信息显示是VM_Thread,指的就是垃圾回收线程。说明当前系统缓慢的原因主要是垃圾回收过于频繁,导致GC停顿时间较长。我们通过如下命令可以查看GC的情况:
jstat -gcutil pid interval(ms) n(打印次数)
网友评论