美文网首页
shell定时清理过期文件/日志

shell定时清理过期文件/日志

作者: 瓜_ | 来源:发表于2019-01-31 15:41 被阅读0次

    前言

    我从事于一家游戏公司,公司有一台日志服务器,用于临时存储各游戏日志进行以便数据清洗操作。日积月累日志文件耗费大量存储空间,导致磁盘空间不足。以下是我清理过期日志的过程

    需求分析

    1.有做备份的日志才能清理。那些日志备份做了备份,记录在另外一个备份脚本内。最好是从备份脚本直接读取需要清理的游戏,以免备份日志与清理的日志不一致导致比不必要的问题

    2.需求是清理6天前的日志。日志文件是增量写入,可以用文件修改时间筛选6天前的日志。有多个目录的日志需要删除,需要查找指定目录下的过期日志,并用循环进行清理操作

    3.开启定时任务执行清理操作,节约人力成本

    具体操作

    1.读取文件中的变量

    同步脚本 rsync_logs.sh ,内容如下 需要提取变量log_dirs的值

    #!rsync_logs.sh
    src="/data/xxx"
    log_dirs="aktw mmga nmgf smzx sdfr sgta get asder ersr erar" 
    logfile="/home/xxx/scripts/rsync.log"
    

    a.读取文件可以用 cat
    b.过滤数据可以用 grep
    c.切割出文本内容用 awk

    使用cat读取文件,使用grep过滤包含log_dirs的行,使用awk根据 " 切割后取出第二个值。命令如下

    cat rsync_logs.sh|grep 'log_dirs='|awk -F '\"' '{print $2}' 
    

    结果:

    aktw mmga nmgf smzx sdfr sgta get asder ersr erar
    
    2.清理6天前的日志

    要清理 /data/logs/aktw/6天前的日志文件

    a.遍历目录下的所有文件
    b.检查日志文件修改时间
    c.删除过期文件

        for file in `find /data/logs/aktw/ -type f -name "*"`   
        do
            local expired_time=$[6*24*60*60]        #此处定义文件的过期时间6天
            local currentDate=`date +%s`            #获取系统时间,所以时间格式为秒
            local modifyDate=$(stat -c %Y $file)    #获取文件修改时间
            local existTime=$[$currentDate-$modifyDate]     #对比时间,算出日志存在时间
            if [ $existTime -gt $expired_time ];
            then
                rm -rf $file    #删除文件
            fi
        done
    

    实际环境要求
    a.删除多个目录
    b.在清理文件后,一并清理空目录
    b.输出日志信息,以便确认/后续观察清理日志操作是否正常。

    完善后的脚步如下:

    #!clean_logs.sh
    cd `dirname $0`     #跳转至当前目录
    log_dirs="$(cat rsync_logs.sh|grep 'log_dirs='|awk -F '\"' '{print $2}')"   #读取同步脚本中的游戏配置
    data_path="/data/logs/"         #文件根目录
    expired_time=$[6*24*60*60]      #此处定义文件的过期时间 6天
    function deletefiles {
        #跳过空目录
        if [ ! -d $1 ];
        then
            return
        fi
        #删除过期文件
        for file in `find $1 -type f -name "*"`     #获取目录下的文件,$1 第一个参数
        do
            local currentDate=`date +%s`            #获取系统时间,所以时间格式为秒
            local modifyDate=$(stat -c %Y $file)    #获取文件修改时间
            local existTime=$[$currentDate-$modifyDate]     #对比时间,算出日志存在时间
            if [ $existTime -gt $expired_time ];
            then
                echo "delete file true ,path:"$file",existTime="$existTime
                rm -rf $file    #删除文件
            else
                echo "delete file false,path:"$file",existTime="$existTime
            fi
        done
        #删除空目录
        for file in `find $1 -type d -name "*"`     #获取目录下的目录,$1 第一个参数
        do
            local dircount=`ls -lR $file|grep "^-"|wc -l`   #获取目录下文件个数 0 则是空目录
            if [ $dircount -eq 0 ] && [ -d $file ];
            then
                echo "delete dir  true ,path:"$file",dircount="$dircount
                rm -rf $file    #删除目录
            else
                echo "delete dir  false,path:"$file",dircount="$dircount
            fi
        done
    }
    #for循环删除多个目录。注意 空格 是linux的转译符之一,因此log_dirs 为集合,非字符串
    for dir in $log_dirs
    do
        deletefiles $data_path$dir/
    done
    
    
    3.将脚本加入定时任务

    使用 crontab -e 编辑定时任务。设置每日02:00:00执行清理脚本,全部日志输出到 /data/scripts/logs/clean_logs.log

    0 2 * * * sh /data/scripts/clean_logs.sh >> /data/scripts/logs/clean_logs.log 2>&1;
    

    crontab时间格式:
    {minute} {hour} {day-of-month} {month} {day-of-week} {full-path-to-shell-script}
    o minute: 区间为 0 – 59
    o hour: 区间为0 – 23
    o day-of-month: 区间为0 – 31
    o month: 区间为1 – 12. 1 是1月. 12是12月.
    o Day-of-week: 区间为0 – 7. 周日可以是0或7.

    4.确认脚本运行状态

    a.先手动执行脚本,完成清理
    b.第二天使用 cat /data/scripts/logs/clean_logs.log 查看日志是否有异常

    四、相关资料

    linux 文件查找 https://www.cnblogs.com/huninglei/p/5824205.html
    Linux下统计目录个数、文件个数 https://blog.csdn.net/llq_200/article/details/80506447
    crontab 详细用法 定时任务 https://www.cnblogs.com/aminxu/p/5993769.html

    相关文章

      网友评论

          本文标题:shell定时清理过期文件/日志

          本文链接:https://www.haomeiwen.com/subject/gviksqtx.html