美文网首页马哥Linux
9-文件查找和压缩

9-文件查找和压缩

作者: Liang_JC | 来源:发表于2020-02-29 15:04 被阅读0次

    本章内容

    ◆ Locate
    ◆ find
    ◆ xargs
    ◆ compress和uncompress
    ◆ gzip和gunzip
    ◆ bzip2和bunzip2
    ◆ xz和unxz
    ◆ zip和unzip
    ◆ tar
    ◆ cpio

    locate

    ● 查询系统上预建的文件索引数据库
        /var/lib/mlocate/mlocate.db
    ● 依赖于事先构建的索引
        索引的构建是在系统较为空闲时自动进行(周期性任务),管理员手动更新数据库(updatedb)
    ● 索引构建过程需要遍历整个根文件系统,极消耗资源
    工作特点:
        查找速度快
        模糊查找
        非实时查找
        搜索的是文件的全路径,不仅仅是文件名
        可能只搜索用户具备读取和执行权限的目录
    

    locate命令

    locate KEYWORD
    有用的选项
    -i 不区分大小写的搜索
    -n N 只列举前N个匹配项目
    -r 使用基本正则表达式
    示例
    搜索名称或路径中带有“conf”的文件
        locate conf
    使用Regex来搜索以“.conf”结尾的文件
        locate -r '\.conf$'
    

    find

    ● 实时查找工具,通过遍历指定路径完成文件查找
    工作特点:
        查找速度略慢
        精确查找
        实时查找
        可能只搜索用户具备读取和执行权限的目录
    
    语法:
    find [OPTION]... [查找路径] [查找条件] [处理动作]
        查找路径:指定具体目标路径;默认为当前目录
        查找条件:指定的查找标准,可以文件名、大小、类型、权限等标准进行;
    默认为找出指定路径下的所有文件
        处理动作:对符合条件的文件做操作,默认输出至屏幕
    

    查找条件

    指搜索层级
        -maxdepth level 最大搜索目录深度,指定目录下的文件为第1级
        -mindepth level 最小搜索目录深度
    先处理目录内的文件,再处理指定目录
        -depth
    根据文件名和inode查找:
        -name "文件名称":支持使用glob
            *, ?, [], [^]
        -iname "文件名称":不区分字母大小写
        -inum n 按inode号查找
        -samefile name 相同inode号的文件
        -links n 链接数为n的文件
        -regex “PATTERN” :以PATTERN匹配整个文件路径,而非文件名称
        
    find /etc/ -maxdepth 2 -mindepth 2      #仅搜第二层
    find /usr/share/pixmaps -regex ".*\.jpg$"   #查找所有.jpg文件
    
    根据属主、属组查找:
        -user USERNAME:查找属主为指定用户(UID)的文件
        -group GRPNAME: 查找属组为指定组(GID)的文件
        -uid UserID:查找属主为指定的UID号的文件
        -gid GroupID:查找属组为指定的GID号的文件
        -nouser:查找没有属主的文件
        -nogroup:查找没有属组的文件
    
    根据文件类型查找
        -type TYPE
        f: 普通文件
        d: 目录文件
        l: 符号链接文件
        s:套接字文件
        b: 块设备文件
        c: 字符设备文件
        p: 管道文件
    空文件或目录
        -empty
        示例:find /app -type d -empty
        
    组合条件:
        与:-a
        或:-o
        非:-not !
    德·摩根定律:
        (非 A) 或 (非 B) = 非(A 且 B)
        (非 A) 且 (非 B) = 非(A 或 B)
    示例:
        !A -a !B = !(A -o B)
        !A -o !B = !(A -a B)
    
    find /data ! -empty -ls             #非空
    find /data -name "f*" -type f       #与
    find /data -name "f*" -o -type f    #或
    find /data \( -name "f*" -o -type f \) -ls  #搜索到结果用ls查看
    
    find示例
        找出/tmp目录下,属主不是root,且文件名不以f开头的文件
        find /tmp \( -not -user root -a -not -name 'f*' \) -ls
        find /tmp -not \( -user root -o -name 'f*' \) -ls
    排除目录
    示例:
        查找/etc/下,除/etc/sane.d目录的其它所有.conf后缀的文件
            find /etc -path ‘/etc/sane.d’ -a -prune -o -name “*.conf”       #prune剪切
        查找/etc/下,除/etc/sane.d和/etc/fonts两个目录的所有.conf后缀的文件
            find /etc \( -path "/etc/sane.d" -o -path "/etc/fonts" \) -a -prune -o -name "*.conf"
            
    根据文件大小来查找:
        -size [+|-]#UNIT
            常用单位:k, M, G,c(byte)
        #UNIT: (#-1, #]
            如:6k 表示(5k,6k]
        -#UNIT:[0,#-1]
            如:-6k 表示[0,5k]
        +#UNIT:(#,∞)
            如:+6k 表示(6k,∞)
        
        find -size -6K  #0-5k       
        find -size 6k   #5-6K
        find -size +6K  #6-∞
        
    根据时间戳:
        以“天”为单位
            -atime [+|-]#,      #读时间
                #: [#,#+1)
                +#: [#+1,∞]
                -#: [0,#)       
            -mtime              #修改时间
            -ctime              #属性改变时间
        以“分钟”为单位
            -amin
            -mmin
            -cmin
    
    find . -mtime +3    #3天以前(4-∞天)
    find . -mtime -3    #3天以内(0-2天)
    find . -mtime 3     #3天前的(3天)
    #find以当前时间24小时之内为第0天,例如:
        2019-12-18 16:00:00 至 2019-12-17 16:00:00   #第0天
        2019-12-17 16:00:00 至 2019-12-16 16:00:00   #第1天
        2019-12-16 16:00:00 至 2019-12-15 16:00:00   #第2天
        2019-12-15 16:00:00 至 2019-12-14 16:00:00   #第3天    
        ......                                      #第N天
    
    image.png
    根据权限查找:
        -perm [/|-]MODE
            MODE: 精确权限匹配
            /MODE:任何一类(u,g,o)对象的权限中只要能一位匹配即可,或关系,+(从centos7开始淘汰)
            -MODE:每一类对象都必须同时拥有指定权限,与关系
            0 表示不关注
        *find -perm 755 会匹配权限模式恰好是755的文件
        *只要当任意人有写权限时,find -perm +222就会匹配
        *只有当每个人都有写权限时,find -perm -222才会匹配
        *只有当其它人(other)有写权限时,find -perm -002才会匹配
        
        精确权限匹配:755
        任意人有:+=/222
        每个人都有:-222
        某个人有:-002
    

    处理动作

    -print:默认的处理动作,显示至屏幕
    -ls:类似于对查找到的文件执行“ls -l” 命令
    -delete:删除查找到的文件
    -fls file:查找到的所有文件的长格式信息保存至指定文件中
    -ok COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令,对于每个文件执行命令之前,都会交互式要求用户确认
    -exec COMMAND {} \; 对查找到的每个文件执行由COMMAND指定的命令
    {}: 用于引用查找到的文件名称自身
    find传递查找到的文件至后面指定的命令时,查找到所有符合条件的文件一次性传递给后面的命令
    
    find /var/log -size +10k -exec cp {} /tmp/test/{}.bak \;
    

    参数替换xargs

    由于很多命令不支持管道|来传递参数,xargs用于产生某个命令的参数,xargs可以读入 stdin 的数据,并且以空格符或回车符将 stdin 的数据分隔成为参数
    许多命令不能接受过多参数,命令执行可能会失败,xargs可以解决
    注意:文件名或者是其他意义的名词内含有空格符的情况
    find和xargs的组合:find | xargs COMMAND
    示例:
        ls | xargs rm                   #删除当前目录下的大量文件
        find /sbin/ -perm +700 | ls -l  #这个命令是错误的
        find /bin/ -perm /7000 | xargs ls -Sl #查找有特殊权限的文件
        find /bin/ -perm -7000 | xargs ls -Sl #此命令和上面有何区别?
        find -type f -name “*.txt” -print0 | xargs -0 rm #以字符nul分隔
        
    seq 10 | xargs -n1 echo     #-n 1个参数为1行
    
    find示例
    备份配置文件,添加.orig这个扩展名
        find -name “*.conf” -exec cp {} {}.orig \;
    提示删除存在时间超过3天以上的joe的临时文件
        find /tmp -ctime +3 -user joe -ok rm {} \;
    在主目录中寻找可被其它用户写入的文件
        find ~ -perm -002 -exec chmod o-w {} \;
    查找/data下的权限为644,后缀为sh的普通文件,增加执行权限
        find /data -type f -perm 644 -name “*.sh” -exec chmod 755 {} \;
    查看/home的目录
        find /home -type d -ls
    

    练习

    1、查找/var目录下属主为root,且属组为mail的所有文件
    find /var -user root -group mail -type f
    
    2、查找/var目录下不属于root、 lp、 gdm的所有文件
    find /var ! -user root -o ! -user lp -o ! -user gdm -type f
    
    3、查找/var目录下最近一周内其内容修改过,同时属主不为root,也不是postfix的文件
    find /var ! \( -user root -o -user postfix \) -type f -mtime -6
    
    4、查找当前系统上没有属主或属组,且最近一个周内曾被访问过的文件
    find /  \( -nouser -o -nogroup \) -atime -6
    
    5、查找/etc目录下大于1M且类型为普通文件的所有文件
    find /etc -size +1M -type f 
    
    6、查找/etc目录下所有用户都没有写权限的文件
    find /etc ! -perm /222 -type f
    
    7、查找/etc目录下至少有一类用户没有执行权限的文件
    find /etc ! -perm /110 -type f
    
    8、查找/etc/init.d目录下,所有用户都有执行权限,且其它用户有写权限的文件
    find /etc/init.d -perm -113 -type f
    

    压缩、解压缩及归档工具

    compress/uncompress
        compress [-dfvcVr] [-b maxbits] [file ...]
            -d 解压缩,相当于uncompress
            -c 结果输出至标准输出,不删除原文件
            -v 显示详情
        uncompress file.Z 解压缩
        zcat file.Z 不显式解压缩的前提下查看文本文件内容
        示例:zcat file.Z >file
    

    gzip/gunzip

    gzip [OPTION]... FILE ...
        -d 解压缩,相当于gunzip
        -c 结果输出至标准输出,保留原文件不改变
        -# 指定压缩比,#取值为1-9,值越大压缩比越大
    gunzip file.gz 解压缩
    zcat file.gz 不显式解压缩的前提下查看文本文件内容
    示例:
        gzip -c messages >messages.gz
        gzip -c -d messages.gz > messages
        zcat messages.gz > messages
        cat messages | gzip > m.gz
    

    bzip2/bunzip2/bzcat

    bzip2 [OPTION]... FILE ...
        -k keep, 保留原文件
        -d 解压缩
        -# 1-9,压缩比,默认为9
    bunzip2 file.bz2 解压缩
    bzcat file.bz2 不显式解压缩的前提下查看文本文件内容
    

    xz/unxz/xzcat

    xz [OPTION]... FILE ...
        -k keep, 保留原文件
        -d 解压缩
        -# 压缩比,取值1-9,默认为6
    unxz file.xz 解压缩
    xzcat file.xz 不显式解压缩的前提下查看文本文件内容
    

    zip/unzip

    打包压缩
        zip -r /backup/sysconfig.zip /etc/sysconfig/
    解包解压缩
        unzip sysconfig.zip
        cat /var/log/messages | zip messages.zip -
        unzip -p message.zip > message  #预览
    

    tar工具

    tar(Tape ARchive,磁带归档的缩写)
    tar [OPTION]...
    (1) 创建归档,保留权限
        tar -cpvf /PATH/FILE.tar FILE...
    (2) 追加文件至归档: 注:不支持对压缩文件追加
        tar -r -f /PATH/FILE.tar FILE...
    (3) 查看归档文件中的文件列表
        tar -t -f /PATH/FILE.tar
    (4) 展开归档
        tar -x -f /PATH/FILE.tar
        tar -x -f /PATH/FILE.tar -C /PATH/
    (5) 结合压缩工具实现:归档并压缩
        -j: bzip2, -z: gzip, -J: xz
        
    find linux-5.1.4/ -name "*.c" | wc -l           #多少个c文件
    cat `find linux-5.1.4/  -name "*.c"` |wc -l     #多少个c文件
    find linux-5.1.4/ -name "*.c" | xargs -n1 cat | wc -l   #所有c文件多少行
    
    #检查命令执行了多久
    time find linux-5.1.4/ -name "*.c" | xargs -n1 cat | wc -l
    time cat `find linux-5.1.4/  -name "*.c"` |wc -l
    
    -exclude 排除文件
        tar zcvf /root/a3.tgz --exclude=/app/host1 --exclude=/app/host2 /app
    -T 选项指定输入文件 -X 选项指定包含要排除的文件列表
        tar zcvf mybackup.tgz -T /root/includefilelist -X /root/excludefilelist
    split:分割一个文件为多个文件
        分割大的 tar 文件为多份小文件
        split -b Size -d tar-file-name prefix-name
        split -b 1M -d mybackup.tgz mybackup-parts
        split -b 1M mybackup.tgz mybackup-parts
        合并:
        cat mybackup-parts* > mybackup.tar.gz
    

    cpio

    功能:复制文件从或到归档
    cpio命令是通过重定向的方式将文件进行打包备份,还原恢复的工具,它可以解压以
        “.cpio” 或者“.tar” 结尾的文件
    cpio [选项] > 文件名或者设备名
    cpio [选项] < 文件名或者设备名
    选项
        -o 将文件拷贝打包成文件或者将文件输出到设备上
        -O filename 输出到指定的归档文件名
        -A 向已存在的归档文件中追加文件
        -i 解包,将打包文件解压或将设备上的备份还原到系统
        -I filename 对指定的归档文件名解压
        -t 预览,查看文件内容或者输出到设备上的文件内容
        -F filename 使用指定的文件名替代标准输入或输出
        -d 解包生成目录,在cpio还原时,自动的建立目录
        -v 显示打包过程中的文件名称
        
    cpio -tv < initramfs    #预览
    cpio -idv < initramfs   #解包
    find | cpio -ov > initramfs.cpio #打包
    
    示例
    将etc目录备份:
        find ./etc -print |cpio -ov >bak.cpio
    将/data内容追加bak.cpio
        find /data | cpio -oA -F bak.cpio
    内容预览
        cpio -tv < etc.cpio
    解包文件
        cpio -idv < etc.cpio
    

    相关文章

      网友评论

        本文标题:9-文件查找和压缩

        本文链接:https://www.haomeiwen.com/subject/ihlofhtx.html