十五、系统调优

作者: 胖虎喜欢小红 | 来源:发表于2020-01-27 11:14 被阅读0次

    简介:系统优化其本质是系统在提供服务的同时,承受压力过大需进行参数调优

    1、查看平均负载

    系统负载System Load:系统CPU繁忙程度的度量,即有多少进程在等待被CPU调度,平均负载(Load Average):一段时间内系统的平均负载,这个一段时间一般取1分钟、5分钟、15分钟

    [root@linux_server ~]# uptime
    10:48:38 up 5 min,  2 users,  load average: 0.05, 0.08, 0.05
    1分钟平均负载,5分钟平均负载,15分钟平均负载分别是0.05,0.08,0.05
    
    [root@linux_server ~]# w    #查看都有哪些用户连接服务器
     10:49:59 up 7 min,  2 users,  load average: 0.01, 0.06, 0.05
    USER     TTY      FROM             LOGIN@   IDLE   JCPU   PCPU WHAT
    root     tty1                      10:43    6:07   0.01s  0.01s -bash
    root     pts/0    192.168.94.1     10:48    7.00s  0.02s  0.01s w
    

    2、查看CPU每隔10min的使用情况

    [root@linux_server ~]# yum -y install sysstat     #装完成之后需要等待一会
    [root@linux_server ~]# sar 
    Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)
    
    08:50:01 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
    09:00:01 PM     all      0.25      0.00      0.44      0.78      0.00     98.52
    09:10:02 PM     all      0.55      0.00      0.32      0.16      0.00     98.98
    Average:        all      0.40      0.00      0.38      0.47      0.00     98.75
    -A:所有报告的总和
    -u:输出CPU使用情况的统计信息
    -v:输出inode、文件和其他内核表的统计信息
    -d:输出每一个块设备的活动信息
    -r:输出内存和交换空间的统计信息
    -b:显示I/O和传送速率的统计信息
    -a:文件读写情况
    -c:输出进程统计信息,每秒创建的进程数
    -R:输出内存页面的统计信息
    -y:终端设备活动情况
    -w:输出系统交换活动信息
    
    例如,每2秒采样一次,连续采样3次,观察CPU 的使用情况
    [root@linux_server ~]# sar -u 2 3
    Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)
    
    09:19:21 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
    09:19:23 PM     all      0.00      0.00      0.50      0.00      0.00     99.50
    09:19:25 PM     all      0.00      0.00      0.00      0.00      0.00    100.00
    09:19:27 PM     all      0.00      0.00      0.00      0.00      0.00    100.00
    Average:        all      0.00      0.00      0.17      0.00      0.00     99.83
    参数详解:
    CPU:all 表示统计信息为所有 CPU 的平均值。
    %user:显示在用户级别(application)运行使用 CPU 总时间的百分比。
    %nice:显示在用户级别,用于nice操作,所占用 CPU 总时间的百分比。
    %system:在核心级别(kernel)运行所使用 CPU 总时间的百分比。
    %iowait:显示用于等待I/O操作占用 CPU 总时间的百分比。
    %steal:管理程序(hypervisor)为另一个虚拟进程提供服务而等待虚拟 CPU 的百分比。
    %idle:显示 CPU 空闲时间占用 CPU 总时间的百分比。
    1. 若 %iowait 的值过高,表示硬盘存在I/O瓶颈。
    2. 若 %idle 的值高但系统响应慢时,有可能是 CPU 等待分配内存,此时应加大内存容量。
    3. 若 %idle 的值持续低于1,则系统的 CPU 处理能力相对较低,表明系统中最需要解决的资源是 CPU。
    ===================================================================================
    例如,每3秒采样一次,连续采样3次,观察内存和交换空间状态
    [root@linux_server ~]# sar -r 3 3
    Linux 3.10.0-693.el7.x86_64 (linux-server)  11/16/2019  _x86_64_    (1 CPU)
    
    09:20:55 PM kbmemfree kbmemused  %memused kbbuffers  kbcached  kbcommit   %commit  kbactive   kbinact   kbdirty
    09:20:58 PM    676148    323548     32.36         0    169548    293372      9.47    136672     91728         0
    09:21:01 PM    676148    323548     32.36         0    169548    293372      9.47    136672     91728         0
    09:21:04 PM    676148    323548     32.36         0    169548    293372      9.47    136676     91728         0
    Average:       676148    323548     32.36         0    169548    293372      9.47    136673     91728         0
    参数详解:
    输出项说明:
    kbmemfree:这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间.
    kbmemused:这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间.
    %memused:这个值是kbmemused和内存总量(不包括swap)的一个百分比.
    kbbuffers和kbcached:这两个值就是free命令中的buffer和cache
    kbcommit:保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap).
    %commit:这个值是kbcommit与内存总量(包括swap)的一个百分比.
    =============================================================================
    

    3.查看进程io使用情况

    [root@linux_server ~]# yum -y install iotop
    [root@linux_server ~]# iotop
    [root@linux_server ~]# iotop -b -n 3 -d 5
    --version #显示版本号 
    -h, --help #显示帮助信息 
    -o, --only #显示进程或者线程实际上正在做的I/O,而不是全部的,可以随时切换按o 
    -b, --batch #运行在非交互式的模式 
    -n NUM, --iter=NUM #在非交互式模式下,设置显示的次数, 
    -d SEC, --delay=SEC #设置显示的间隔秒数,支持非整数值 
    -p PID, --pid=PID #只显示指定PID的信息 
    -u USER, --user=USER #显示指定的用户的进程的信息 
    -P, --processes #只显示进程,一般为显示所有的线程 
    -a, --accumulated #显示从iotop启动后每个线程完成了的IO总数 
    -k, --kilobytes #以千字节显示 
    -t, --time #在每一行前添加一个当前的时间
    IO #IO利用率
    

    4.查看内存使用情况

    [root@linux_server ~]# vmstat
    procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----
     r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st
     2  0      0 648128   2108 251128    0    0   334    30  122  186  0  1 99  0  0
    
    r: 表示运行和等待CPU时间片的进程数(就是说多少个进程真的分配到CPU),这个值如果长期大于系统CPU个数,说明CPU 不足,需要增加CPU  
    b:表示在等待资源的进程数。 
     
    2、memory 
    swpd:表示切换到内存交换区的内存大小,即虚拟内存已使用的大小(单位KB),如果大于0,表示你的机器物理内存不足 了,如果不是程序内存泄露的原因,那么你该升级内存了或者把耗内存的任务迁移到其他机器。 
    free:表示当前空闲的物理内存 
    buff:表示baffers cached内存大小,也就是缓冲大小,一般对块设备的读写才需要缓冲 
    Cache:表示page cached的内存大小,也就是缓存大小,一般作为文件系统进行缓冲,频繁访问的文件都会被缓存,如果 cache值非常大说明缓存文件比较多,如果此时io中的bi比较小,说明文件系统效率比较好 
     
    3、swap 
    si:表示有磁盘调入内存,也就是内存进入内存交换区的内存大小;通俗的讲就是 每秒从磁盘读入虚拟内存的大小,如果这 个值大于0,表示物理内存不够用或者内存泄露了,要查找耗内存进程解决掉。
    so:表示由内存进入磁盘,也就是由内存交换区进入内存的内存大小。 注意:一般情况下si、so的值都为0,如果si、so的值长期不为0,则说明系统内存不足,需要增加系统内存 
     
    4、io 
    bi:表示由块设备读入数据的总量,即读磁盘,单位kb/s 
    bo:表示写到块设备数据的总量,即写磁盘,单位kb/s 
    注意:如果bi+bo的值过大,且wa值较大,则表示系统磁盘IO瓶颈
    

    5.释放buffffer和cache

    [root@linux_server ~]# echo 3 > /proc/sys/vm/drop_caches
    

    6.带宽使用情况

    [root@linux_server ~]# yum install -y epel*
    [root@linux_server ~]# yum install -y iftop.x86_64
    [root@linux_server ~]# iftop
    
    image.png
    第一行:界面上面显示的是类似刻度尺的刻度范围,为显示流量图形的长条作标尺用的。
    中间部分:中间的<= =>这两个左右箭头,表示的是流量的方向。=>代表发送,<=代表接收。
    TX:发送流量
    RX:接收流量
    TOTAL:总流量
    Cumm:运行iftop到目前时间的总流量
    peak:流量峰值
    rates:分别表示过去 2s 10s 40s 的平均流量
    

    7.动态查看进程

    [root@linux_server ~]# yum -y install htop
    [root@linux_server ~]# htop
    
    image.png
    各项从上至下分别说明如下:
    左边部分从上至下,分别为,cpu、内存、交换分区的使用情况,右边部分为:Tasks为进程总数,当前运行的进程数、Load average为系统1分钟,5分钟,10分钟的平均负载情况、Uptime为系统运行的时间。
    以上各项分别为:
    PID:进行的标识号
    USER:运行此进程的用户
    PRI:进程的优先级
    NI:进程的优先级别值,默认的为0,可以进行调整
    VIRT:进程占用的虚拟内存值
    RES:进程占用的物理内存值
    SHR:进程占用的共享内存值
    S:进程的运行状况,R表示正在运行、S表示休眠,等待唤醒、Z表示僵死状态
    %CPU:该进程占用的CPU使用率
    %MEM:该进程占用的物理内存和总内存的百分比
    TIME+:该进程启动后占用的总的CPU时间
    COMMAND:进程启动的启动命令名称
    
    #Linux htop工具使用详解  -----了解
    h, ?    F1  查看htop使用说明
    S   F2  htop 设定
    /   F3  搜索进程
    \   F4  增量进程过滤器
    t   F5  显示树形结构
    <, >    F6  选择排序方式
    [   F7  可减少nice值可以提高对应进程的优先级
    ]   F8  可增加nice值,降低对应进程的优先级
    k   F9  可对进程传递信号
    q   F10 结束htop
    u   只显示一个给定的用户的过程
    U   取消标记所有的进程
    H   显示或隐藏用户线程
    K   显示或隐藏内核线程
    F   跟踪进程
    P   按CPU 使用排序
    M   按内存使用排序
    T   按Time+ 使用排序
    l   显示进程打开的文件
    I   倒转排序顺序
    s   选择某进程,按s:用strace追踪进程的系统调用
    

    8.监控网速

    [root@linux_server ~]# yum -y install nload
    [root@linux_server ~]# nload
    
    image.png
    上半部分是:Incoming也就是进入网卡的流量
    下半部分是:Outgoing,也就是从这块网卡出去的流量, 
    每部分都有当前流量(Curr), 
    平均流量(Avg), 
    最小流量(Min), 
    最大流量(Max), 
    总和流量(Ttl).
    

    9.网络接口统计报告

    [root@linux_server ~]# yum -y install nethogs
    [root@linux_server ~]# nethogs
    
    image.png
    实例1:设置5秒钟刷新一次,通过-d来指定刷新频率 
    # nethogs -d 5 
    实例2:监视ens33网络带宽 
    # nethogs ens33 
    实例3:同时监视eth0和eth1接口 
    # nethogs ens33 ens34
    

    10.文件句柄

    在linux/unix操作系统中一切皆文件,我们的设备是文件,文件是文件,文件夹也是文件。当我们用户每发起一次请求,就会产生一个文件句柄。文件句柄可以简单的理解为文件句柄就是一个索引。文件句柄就会随着请求量的增多,进程调用频繁增加,那么产生的文件句柄也就会越多。

    系统默认对文件句柄是有限制的,不可能会让一个进程无限制的调用句柄。因为系统资源是有限的,所以我们需要限制每一个服务能够使用多大的文件句柄。操作系统默认使用的文件句柄是1024个句柄。

    10-1.设置方式

    • 系统全局性修改
    [root@nginx_server ~]# vim /etc/security/limits.conf 
    
    #*               soft    core            0
    #*               hard    rss             10000
    #@student        hard    nproc           20
    #@faculty        soft    nproc           20
    #@faculty        hard    nproc           50
    #ftp             hard    nproc           0
    #@student        -       maxlogins       4
    
    #root只是针对root这个用户来限制,soft只是发提醒,操作系统不会强制限制,一般的站点设置为一万左右就ok了
    root soft nofile 65535
    root hard nofile 65535
    # *代表通配符 所有的用户
    *    soft nofile 25535
    *    hard nofile 25535  #hard硬控制,到达设定值后,操作系统会采取机制对当前进程进行限制,这个时候请求就会受到影响
    

    可以看到root*,root代表是root用户,*代表的是所有用户,后面的数字就是文件句柄大小。
    大家可以根据个人业务来进行设置。

    ulimit 命令
    # -a  显示目前资源限制的设定。
    • -c <core文件上限>  设定core文件的最大值,单位为区块。
    • -d <数据节区大小>  程序数据节区的最大值,单位为KB。
    • -f <文件大小>  shell所能建立的最大文件,单位为区块。
    • -H  设定资源的硬性限制,也就是管理员所设下的限制。
    • -m <内存大小>  指定可使用内存的上限,单位为KB。
    # -n <文件数目>  指定同一时间最多可开启的文件数。
    • -p <缓冲区大小>  指定管道缓冲区的大小,单位512字节。
    • -s <堆叠大小>  指定堆叠的上限,单位为KB。
    • -S  设定资源的弹性限制。
    • -t <CPU时间>  指定CPU使用时间的上限,单位为秒。
    • -u <程序数目>  用户最多可开启的程序数目。
    • -v <虚拟内存大小>  指定可使用的虚拟内存上限,单位为KB
    
    
    1、ulimit -a       显示系统资源的设置
    core file size          (blocks, -c) 0
    data seg size           (kbytes, -d) unlimited
    scheduling priority             (-e) 0
    file size               (blocks, -f) unlimited
    pending signals                 (-i) 63154
    max locked memory       (kbytes, -l) 64
    max memory size         (kbytes, -m) unlimited
    open files                      (-n) 1024
    pipe size            (512 bytes, -p) 8
    POSIX message queues     (bytes, -q) 819200
    real-time priority              (-r) 0
    stack size              (kbytes, -s) 8192
    cpu time               (seconds, -t) unlimited
    max user processes              (-u) 63154
    virtual memory          (kbytes, -v) unlimited
    file locks                      (-x) unlimited
    
    2、ulimit -n 65535  #修改打开句柄数  ---临时
    

    相关文章

      网友评论

        本文标题:十五、系统调优

        本文链接:https://www.haomeiwen.com/subject/uyojthtx.html