美文网首页
HDFS 目录操作

HDFS 目录操作

作者: analanxingde | 来源:发表于2018-12-21 23:05 被阅读10次

    按照时间排列选取时间最近的两个文件夹,并将里面的内容保存下来,可以用于计算变化率

    #path按照第六第七列(时间)排序,选取前两个的第八列(文件路径名)
    paths=`hadoop fs -ls $HDFS_path | sort -r -k6,7 |head -n 2 |awk '{print $8}'`
    #按照空格切分
    read -a WORDS <<< $paths
    
    if[ ${#array[@]} -ne 2 ];then
        echo "there is less than two copies of history data"
        exit 0
    fi
    hadoop fs -cat ${WORDS[0]}/*/*/part-* > ../data/new.data
    hadoop fs -cat ${WORDS[1]}/*/*/part-* > ../data/old.data
    

    相关文章

      网友评论

          本文标题:HDFS 目录操作

          本文链接:https://www.haomeiwen.com/subject/axqawftx.html