美文网首页
【大数据】Spark 递归读取 HDFS

【大数据】Spark 递归读取 HDFS

作者: 焰火青春 | 来源:发表于2021-09-08 12:35 被阅读0次

    HDFS 若有子目录,Spark 是不能递归读取子目录,需要在 spark-submit 中配置以下参数:

    -- conf spark.hadoop.mapreduce.input.fileinputformat.input.dir.recursive=true\
    -- conf spark.hive.mapred.supports.subdirectories=true```

    相关文章

      网友评论

          本文标题:【大数据】Spark 递归读取 HDFS

          本文链接:https://www.haomeiwen.com/subject/ykrvwltx.html