美文网首页
linux下检查文件系统的操作流程(sigbus,linux不能

linux下检查文件系统的操作流程(sigbus,linux不能

作者: 冰天 | 来源:发表于2019-07-08 19:03 被阅读0次

    linux下检查文件系统的操作流程

    问题描述

    ls,cd好用
    vim,touch,mv,cp跟文件操作有关的命令都不好用(core,收收到sigbus信号)
    现把查找问题过程记录一下。

    结果是:硬件厂商发现硬盘卡槽坏了。


    image.png

    然后查看内存和cpu - top

    top - 16:37:32 up 84 days, 23:45,  2 users,  load average: 6.45, 6.58, 6.34
    Tasks: 333 total,   2 running, 331 sleeping,   0 stopped,   0 zombie
    Cpu(s): 25.5%us,  0.8%sy,  0.0%ni, 73.6%id,  0.1%wa,  0.0%hi,  0.1%si,  0.0%st
    Mem:  24595068k total, 21369000k used,  3226068k free,   177460k buffers
    Swap: 12369912k total, 12179320k used,   190592k free,  1670544k cached
    
      PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
     5109 dbojc     20   0 10.9g 919m 7436 S 170.4  3.8  26882:51 java
    29048 dfs       20   0 6724m 1.2g 6128 S 104.2  4.9  60764:37 java
    27850 vomes     20   0 14.2g 1.4g  25m S 100.1  6.2  41860:29 java
    28484 skywalki  20   0 10.2g 534m 6560 S 31.1  2.2  12982:25 java
     2704 webadmin  20   0 10.8g 1.5g 8252 S  7.4  6.3   1182:03 java
    21790 vomcente  20   0 15.7g 2.2g 768m S  2.9  9.4  10:40.10 java
    13441 sentine   20   0 15.7g 238m 5960 S  1.6  1.0 984:03.28 java
     1964 vdm       20   0 9152m 1.3g 5784 S  0.8  5.3  45:05.20 java
     8985 das5      20   0 10.9g 867m 7140 S  0.8  3.6 438:49.40 java
    19058 das       20   0 10.6g 1.3g 7508 S  0.8  5.7  39:12.16 java
    28439 apollo    20   0 15.9g 794m 5972 S  0.8  3.3 614:01.74 java
        4 root      20   0     0    0    0 S  0.4  0.0  16:53.86 ksoftirqd/0
      235 root      39  19     0    0    0 S  0.4  0.0 601:23.38 kipmi0
     1281 root      20   0     0    0    0 S  0.4  0.0 377:25.64 jbd2/dm-2-8
     1633 root      20   0     0    0    0 S  0.4  0.0  85:40.48 kondemand/3
     1635 root      20   0     0    0    0 S  0.4  0.0 107:20.59 kondemand/5
     1641 root      20   0     0    0    0 S  0.4  0.0  73:44.75 kondemand/11
    

    发现资源都正常,尤其是CPU和硬盘

    首先查看硬盘空间

    root-/root>df -h
    Filesystem                    Size  Used Avail Use% Mounted on
    /dev/mapper/VolGroup-lv_root   50G   19G   28G  41% /
    tmpfs                          12G     0   12G   0% /dev/shm
    /dev/sda2                     485M   65M  395M  15% /boot
    /dev/sda1                     200M  264K  200M   1% /boot/efi
    /dev/mapper/VolGroup-lv_home  213G  134G   69G  66% /home
    

    发现磁盘并没有满,还有很大的空间。

    查看是否打开文件最大数满了

    标准版渠道开发/stdcop/xip>ulimit -a
    core file size          (blocks, -c) unlimited
    data seg size           (kbytes, -d) unlimited
    scheduling priority             (-e) 0
    file size               (blocks, -f) unlimited
    pending signals                 (-i) 515915
    max locked memory       (kbytes, -l) 64
    max memory size         (kbytes, -m) unlimited
    open files                      (-n) 65536
    pipe size            (512 bytes, -p) 8
    POSIX message queues     (bytes, -q) 819200
    real-time priority              (-r) 0
    stack size              (kbytes, -s) 10240000
    cpu time               (seconds, -t) unlimited
    max user processes              (-u) 4096
    virtual memory          (kbytes, -v) unlimited
    file locks                      (-x) unlimited
    
    标准版渠道开发/stdcop/xip>lsof|wc
       2877   25192  313127
    

    发现2877 << 65536

    查看文件节点数(是否满了)

    root-/root>df -i
    Filesystem                     Inodes  IUsed    IFree IUse% Mounted on
    /dev/mapper/VolGroup-lv_root  3276800  94377  3182423    3% /
    tmpfs                         3074383      1  3074382    1% /dev/shm
    /dev/sda2                      128016     27   127989    1% /boot
    /dev/sda1                           0      0        0     - /boot/efi
    /dev/mapper/VolGroup-lv_home 14155776 177977 13977799    2% /home
    

    发现文件的inode还剩余很多,如果碎文件太多,可能会导致inode不够(鞍山发生过)

    查看最大文件个数

    root-/root>cat /proc/sys/fs/file-max
    524288
    

    查看组大的文件个数,发现是52W,统计一下唯一的用户的文件个数

    锦州XIP/jzbank/jzxip/src>ls -R|wc
      44958   42176  657329
    

    基本上没多大

    检查linux系统message错误

    vi /var/log/messages
    

    发现打不开,因为文件系统已经有问题了。要么写了读不了,要么硬盘有问题系统没写进去。

    重启服务器,开始硬件自检

    发现硬盘异常,拆机检查,发现硬盘卡槽坏了。
    问题解决。

    相关文章

      网友评论

          本文标题:linux下检查文件系统的操作流程(sigbus,linux不能

          本文链接:https://www.haomeiwen.com/subject/thnahctx.html