

作者: 冬天里的懒喵 | 来源:发表于2021-07-13 19:52 被阅读0次

最近在极客时间学习了倪朋飞老师的《Linux性能优化实战》专题,里面讲到了linux的平均负载这个概念。也就是load average。现在谈谈对平均负载的理解,并整理为笔记。


1.1 如何查看系统的平均负载?

当我们通过ssh进入linux系统之后,通常来说,有两种方式可以查看这个load average.

  • uptime


[root@m162p201 ~]# uptime
 15:26:21 up 621 days,  8:06,  1 user,  load average: 0.00, 0.01, 0.05
  • top


[root@m162p201 ~]# top
top - 15:26:59 up 621 days,  8:07,  1 user,  load average: 0.00, 0.01, 0.05
Tasks: 106 total,   1 running, 105 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.5 us,  0.5 sy,  0.0 ni, 98.8 id,  0.0 wa,  0.0 hi,  0.0 si,  0.2 st
KiB Mem :  8175664 total,  2006684 free,  4863032 used,  1305948 buff/cache
KiB Swap:  4063228 total,  4063228 free,        0 used.  2626032 avail Mem 

通过上述两种方法,都可以得到load average。
我们看到这个load average的值由3个分隔的数字构成。

1.2 平均负载概念

让我们看看平均负载的解释,man uptime中的描述如下:

    uptime  gives a one line display of the following information.  The current time, how long the system has been running, how many users are currently logged on, and the system load averages for the
       past 1, 5, and 15 minutes.

       This is the same information contained in the header line displayed by w(1).

       System load averages is the average number of processes that are either in a runnable or uninterruptable state.  A process in a runnable state is either using the CPU or waiting to use the CPU.  A
       process  in  uninterruptable  state  is waiting for some I/O access, eg waiting for disk.  The averages are taken over the three time intervals.  Load averages are not normalized for the number of
       CPUs in a system, so a load average of 1 means a single CPU system is loaded all the time while on a 4 CPU system it means it was idle 75% of the time.

这个定义为:系统的平均负载(load averages)是处于Runnable(运行)状态和Uninterruptable(不可中断)状态的两种状态下的进程在单位时间内的平均数。对,没有看错,这里说的是平均的进程数量,与CPU本身的使用率没有直接关系。这个load averages实际上表示的是系统中的平均活跃进程数


  • Runnable


  • Uninterruptable



1.3 扩展

1.3.1 ps中的进程状态

通过ps命令我们可以查看linux中的进程状态,通常的如 ps -aux。

[root@m162p201 ~]# ps -aux
root         1  0.0  0.0  51720  3484 ?        Ss    2019 203:55 /usr/lib/systemd/systemd --system --deserialize 22
root         2  0.0  0.0      0     0 ?        S     2019   0:04 [kthreadd]
root         3  0.0  0.0      0     0 ?        S     2019   9:45 [ksoftirqd/0]
root         7  0.0  0.0      0     0 ?        S     2019   0:07 [migration/0]
root         8  0.0  0.0      0     0 ?        S     2019   0:00 [rcu_bh]
root         9  0.0  0.0      0     0 ?        S     2019 262:40 [rcu_sched]
root        10  0.0  0.0      0     0 ?        S     2019   4:27 [watchdog/0]
root        11  0.0  0.0      0     0 ?        S     2019   4:04 [watchdog/1]
root        12  0.0  0.0      0     0 ?        S     2019   0:06 [migration/1]
root        13  0.0  0.0      0     0 ?        S     2019  26:33 [ksoftirqd/1]
root        17  0.0  0.0      0     0 ?        S<    2019   0:00 [khelper]
root        18  0.0  0.0      0     0 ?        S     2019   0:00 [kdevtmpfs]
root        19  0.0  0.0      0     0 ?        S<    2019   0:00 [netns]
root        20  0.0  0.0      0     0 ?        S     2019   0:36 [khungtaskd]
root        21  0.0  0.0      0     0 ?        S<    2019   0:00 [writeback]
root        22  0.0  0.0      0     0 ?        S<    2019   0:00 [kintegrityd]
root        23  0.0  0.0      0     0 ?        S<    2019   0:00 [bioset]
root        24  0.0  0.0      0     0 ?        S<    2019   0:00 [kblockd]


列名 说明
USER 进程所有者用户名。
PID 用来唯一标识的进程ID(进程号)
%CPU 进程占用CPU的百分比。
%MEM 进程占用内存的百分比。
VSZ 进程使用的虚拟内存的大小,单位KB
RSS 进程使用物理内存的总page数,这是内存管理的最小单位,每个page为4k
TTY 进程所在的终端ID
STAT 进程的状态,后面详细介绍。
START 进程启动时间
TIME 进程占用总CPU的时间
COMMAND 进程执行的命令和参数


状态 说明
R 可运行状态,此时进程处于正在运行或者正在运行的队列中准备运行
S 可中断状态。处于可中断的某一状态的进程可以被中断信号中断。
D 不可中断状态。处于不可中断的等待状态的进程不可被中断信号中断,将一直等待事件发生或者直到某种系统资源完成。
T 暂停状态,处于暂停状态的进程被暂停运行
Z 僵死状态,每个进程在运行结束之后都会处于僵死状态,等待父进程的调用而释放资源,处于该状态的进程已经运行结束,但是其父进程并没有释放其资源,或者父进程已经死亡


附加状态 说明
< 高优先级进程。
N 低优先级进程。
L 存在某些页面被锁在内存中
s 主进程
l 开启了多线程的进程
+ 前台进程

1.3.2 如何查看CPU数量


[root@m162p201 ~]# grep 'model name' /proc/cpuinfo |wc -l


但是现在问题是,load averages存在3个值,我们应该参考哪个值呢?






  • CPU密集型进程,使用大量CPU进行密集运算会导致平均负载升高,此时这两者是一致的;
  • I/O密集型进程,等待I/O也会导致平均负载升高,但CPU使用率不一定很高;
  • 大量等待CPU的进程调度也会导致平均负载升高,此时的CPU使用率也会比较高。





[root@m162p201 ~]# lsb_release -a
LSB Version:    :core-4.1-amd64:core-4.1-noarch:cxx-4.1-amd64:cxx-4.1-noarch:desktop-4.1-amd64:desktop-4.1-noarch:languages-4.1-amd64:languages-4.1-noarch:printing-4.1-amd64:printing-4.1-noarch
Distributor ID: CentOS
Description:    CentOS Linux release 7.7.1908 (Core)
Release:    7.7.1908
Codename:   Core


yum install -y stress sysstat

stress是一个Linux压力测试工具,存在于epel包中。sysstat包含了常用的linux性能工具。用于监控和分析系统性能。这个包括两个命令,mpstat和pidstat,其中mpstat是一个多核的CPU性能分析工具,用来查看CPU的实时性能指标和平均性能指标。而pidstat则是一个性能分析的工具。可以实时查看PU、内存、I/O 以及上下文切换等性能指标。

4.1 CPU密集型进程


[root@m162p201 ~]# stress --cpu 1 --timeout 600
stress: info: [11708] dispatching hogs: 1 cpu, 0 io, 0 vm, 0 hdd


watch -d uptime


[root@m162p201 ~]# mpstat -P ALL 5 1
Linux 3.10.0-514.el7.x86_64 (m162p201)  07/13/2021  _x86_64_    (2 CPU)

06:44:39 PM  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
06:44:44 PM  all   50.96    0.00    0.61    0.00    0.00    0.00    0.00    0.00    0.00   48.43
06:44:44 PM    0    4.49    0.00    1.22    0.00    0.00    0.00    0.00    0.00    0.00   94.29
06:44:44 PM    1   96.59    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    3.41

Average:     CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
Average:     all   50.96    0.00    0.61    0.00    0.00    0.00    0.00    0.00    0.00   48.43
Average:       0    4.49    0.00    1.22    0.00    0.00    0.00    0.00    0.00    0.00   94.29
Average:       1   96.59    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    3.41


[root@m162p201 ~]# pidstat -u 5 1
Linux 3.10.0-514.el7.x86_64 (m162p201)  07/13/2021  _x86_64_    (2 CPU)

06:49:57 PM   UID       PID    %usr %system  %guest    %CPU   CPU  Command
06:50:02 PM     0         1    0.00    0.20    0.00    0.20     0  systemd
06:50:02 PM     0         9    0.00    0.20    0.00    0.20     0  rcu_sched
06:50:02 PM  1008      5244    0.20    0.80    0.00    1.00     0  java
06:50:02 PM  1008      8031    6.60    5.20    0.00   11.80     1  java
06:50:02 PM  1007     10589    0.00    0.80    0.00    0.80     1  java
06:50:02 PM     0     11709   99.80    0.20    0.00  100.00     1  stress
06:50:02 PM     0     11785    0.20    0.00    0.00    0.20     0  watch
06:50:02 PM     0     18040    0.40    0.60    0.00    1.00     0  etcd
06:50:02 PM   998     18737    0.00    0.20    0.00    0.20     0  polkitd
06:50:02 PM  1001     32703    0.00    0.20    0.00    0.20     1  java

Average:      UID       PID    %usr %system  %guest    %CPU   CPU  Command
Average:        0         1    0.00    0.20    0.00    0.20     -  systemd
Average:        0         9    0.00    0.20    0.00    0.20     -  rcu_sched
Average:     1008      5244    0.20    0.80    0.00    1.00     -  java
Average:     1008      8031    6.60    5.20    0.00   11.80     -  java
Average:     1007     10589    0.00    0.80    0.00    0.80     -  java
Average:        0     11709   99.80    0.20    0.00  100.00     -  stress
Average:        0     11785    0.20    0.00    0.00    0.20     -  watch
Average:        0     18040    0.40    0.60    0.00    1.00     -  etcd
Average:      998     18737    0.00    0.20    0.00    0.20     -  polkitd
Average:     1001     32703    0.00    0.20    0.00    0.20     -  java


4.2 I/O密集型


[root@m162p201 ~]# stress -i 1 --timeout 600
stress: info: [12898] dispatching hogs: 0 cpu, 1 io, 0 vm, 0 hdd




[root@m162p201 ~]# mpstat -P ALL 5 1
Linux 3.10.0-514.el7.x86_64 (m162p201)  07/13/2021  _x86_64_    (2 CPU)

06:54:14 PM  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
06:54:19 PM  all    0.62    0.00   46.15    1.13    0.00    0.00    0.10    0.00    0.00   52.00
06:54:19 PM    0    1.42    0.00    1.22    0.00    0.00    0.00    0.00    0.00    0.00   97.36
06:54:19 PM    1    0.00    0.00   92.28    2.30    0.00    0.00    0.00    0.00    0.00    5.43

Average:     CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
Average:     all    0.62    0.00   46.15    1.13    0.00    0.00    0.10    0.00    0.00   52.00
Average:       0    1.42    0.00    1.22    0.00    0.00    0.00    0.00    0.00    0.00   97.36
Average:       1    0.00    0.00   92.28    2.30    0.00    0.00    0.00    0.00    0.00    5.43

可以看到1分钟内,系统负载上升到, 1.22而1号CPU的sys状态为92.8,这说明load的上升是由于IO造成的。

[root@m162p201 ~]# pidstat -u 5 1
Linux 3.10.0-514.el7.x86_64 (m162p201)  07/13/2021  _x86_64_    (2 CPU)

06:57:49 PM   UID       PID    %usr %system  %guest    %CPU   CPU  Command
06:57:54 PM  1008      5244    0.20    0.80    0.00    1.00     0  java
06:57:54 PM     0      6533    0.00    0.20    0.00    0.20     0  kworker/u4:2
06:57:54 PM  1008      8031    0.00    0.40    0.00    0.40     1  java
06:57:54 PM     0      8985    0.00    0.20    0.00    0.20     1  kworker/1:2H
06:57:54 PM  1002      9636    0.00    0.20    0.00    0.20     1  java
06:57:54 PM  1007     10589    0.20    0.80    0.00    1.00     1  java
06:57:54 PM     0     12899    0.00   93.00    0.00   93.00     0  stress
06:57:54 PM     0     12907    0.20    0.20    0.00    0.40     1  watch
06:57:54 PM     0     12921    0.00    0.20    0.00    0.20     0  kworker/u4:0
06:57:54 PM     0     13490    0.00    0.20    0.00    0.20     1  pidstat
06:57:54 PM     0     13497    0.00    0.20    0.00    0.20     0  kworker/u4:1
06:57:54 PM     0     18691    0.20    0.00    0.00    0.20     0  irqbalance
06:57:54 PM     0     18778    0.00    0.20    0.00    0.20     1  kworker/1:2
06:57:54 PM  1001     32703    0.00    0.20    0.00    0.20     1  java

Average:      UID       PID    %usr %system  %guest    %CPU   CPU  Command
Average:     1008      5244    0.20    0.80    0.00    1.00     -  java
Average:        0      6533    0.00    0.20    0.00    0.20     -  kworker/u4:2
Average:     1008      8031    0.00    0.40    0.00    0.40     -  java
Average:        0      8985    0.00    0.20    0.00    0.20     -  kworker/1:2H
Average:     1002      9636    0.00    0.20    0.00    0.20     -  java
Average:     1007     10589    0.20    0.80    0.00    1.00     -  java
Average:        0     12899    0.00   93.00    0.00   93.00     -  stress
Average:        0     12907    0.20    0.20    0.00    0.40     -  watch
Average:        0     12921    0.00    0.20    0.00    0.20     -  kworker/u4:0
Average:        0     13490    0.00    0.20    0.00    0.20     -  pidstat
Average:        0     13497    0.00    0.20    0.00    0.20     -  kworker/u4:1
Average:        0     18691    0.20    0.00    0.00    0.20     -  irqbalance
Average:        0     18778    0.00    0.20    0.00    0.20     -  kworker/1:2
Average:     1001     32703    0.00    0.20    0.00    0.20     -  java


4.3 多进程场景


[root@m162p201 ~]# stress -c 8 --timeout 600
stress: info: [15557] dispatching hogs: 8 cpu, 0 io, 0 vm, 0 hdd




[root@m162p201 ~]# mpstat -P ALL 5 1
Linux 3.10.0-514.el7.x86_64 (m162p201)  07/13/2021  _x86_64_    (2 CPU)

07:38:44 PM  CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
07:38:49 PM  all   99.70    0.00    0.20    0.00    0.00    0.10    0.00    0.00    0.00    0.00
07:38:49 PM    0  100.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00
07:38:49 PM    1   99.80    0.00    0.20    0.00    0.00    0.00    0.00    0.00    0.00    0.00

Average:     CPU    %usr   %nice    %sys %iowait    %irq   %soft  %steal  %guest  %gnice   %idle
Average:     all   99.70    0.00    0.20    0.00    0.00    0.10    0.00    0.00    0.00    0.00
Average:       0  100.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00
Average:       1   99.80    0.00    0.20    0.00    0.00    0.00    0.00    0.00    0.00    0.00
[root@m162p201 ~]# 


[root@m162p201 ~]# pidstat -u 5 1
Linux 3.10.0-514.el7.x86_64 (m162p201)  07/13/2021  _x86_64_    (2 CPU)

07:37:54 PM   UID       PID    %usr %system  %guest    %CPU   CPU  Command
07:37:59 PM  1008      8031    0.20    0.00    0.00    0.20     1  java
07:37:59 PM  1007     10589    0.20    0.20    0.00    0.40     1  java
07:37:59 PM     0     15558   24.60    0.00    0.00   24.60     0  stress
07:37:59 PM     0     15559   24.40    0.00    0.00   24.40     0  stress
07:37:59 PM     0     15560   24.60    0.00    0.00   24.60     0  stress
07:37:59 PM     0     15561   24.60    0.00    0.00   24.60     1  stress
07:37:59 PM     0     15562   24.60    0.00    0.00   24.60     1  stress
07:37:59 PM     0     15563   25.00    0.00    0.00   25.00     1  stress
07:37:59 PM     0     15564   25.00    0.00    0.00   25.00     0  stress
07:37:59 PM     0     15565   24.60    0.00    0.00   24.60     1  stress
07:37:59 PM     0     15571    0.00    0.20    0.00    0.20     1  watch
07:37:59 PM     0     18040    0.40    0.20    0.00    0.60     0  etcd
07:37:59 PM     0     18778    0.00    0.20    0.00    0.20     1  kworker/1:2
07:37:59 PM  1001     32703    0.20    0.00    0.00    0.20     1  java

Average:      UID       PID    %usr %system  %guest    %CPU   CPU  Command
Average:     1008      8031    0.20    0.00    0.00    0.20     -  java
Average:     1007     10589    0.20    0.20    0.00    0.40     -  java
Average:        0     15558   24.60    0.00    0.00   24.60     -  stress
Average:        0     15559   24.40    0.00    0.00   24.40     -  stress
Average:        0     15560   24.60    0.00    0.00   24.60     -  stress
Average:        0     15561   24.60    0.00    0.00   24.60     -  stress
Average:        0     15562   24.60    0.00    0.00   24.60     -  stress
Average:        0     15563   25.00    0.00    0.00   25.00     -  stress
Average:        0     15564   25.00    0.00    0.00   25.00     -  stress
Average:        0     15565   24.60    0.00    0.00   24.60     -  stress
Average:        0     15571    0.00    0.20    0.00    0.20     -  watch
Average:        0     18040    0.40    0.20    0.00    0.60     -  etcd
Average:        0     18778    0.00    0.20    0.00    0.20     -  kworker/1:2
Average:     1001     32703    0.20    0.00    0.00    0.20     -  java


5 总结



  • 对linux系统中“平均负载”的理解


  • 理解Linux系统的平均负载

    1. 平均负载的查看 在Linux系统中,如果我们想查看系统的负载,可以通过top指令或者uptime指令。以up...

  • 理解系统平均负载

    查看系统配置 查看系统版本lsb_release -a 查看内存 查看CPUcat /proc/cpuinfo 查...

  • Linux性能分析(未完待续)

    Linux性能 CPU 平均负载 平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均活跃进程数 可运行...

  • CPU 平均负载

    在本文中,我们将解释 Linux 系统中最关键的管理任务之一——关于系统 / CPU 的负载load和平均负载Lo...

  • 简谈JVM之性能监控和调优

    性能监控 linux命令监控uptime 显示系统运行时间、连接数、负载情况top 系统运行时间、平均负载情况、...

  • 如何理解系统平均负载

    系统平均负载 简单来说,平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进行数(ps命令看到的处于R...

  • 如何理解linux的平均负载?


  • 平均负载

    工具列表 top,替代物 htop uptime 查看系统平均负载 stress 是一个 Linux 系统压力测试...

  • 系统工具(uptime,vmstat,iostat,top)

    linux 系统工具 uptime 显示内容: 当前时间 系统已启动的时间 当前上线人数 系统平均负载(1、5、1...


