Spark结构化API数据源—

Spark结构化API数据源——文本文件

作者: lukeyan | 来源:发表于2021-03-30 08:06 被阅读0次

一、读文本文件
读文本文件非常简单：只需要指定类型为textFile即可。如果使用textFile，分区目录名将被忽略。如果要根据分区读取和写入文本文件，你应该使用text，它会在读写时考虑分区

    spark.read.textFile("/data/flight-data/csv/2010-summary.csv")
      .selectExpr("split(value, ',') as rows").show()

二、写文本文件

csvFile.select("DEST_COUNTRY_NAME").write.text("tmp/simple-text-file.txt")

csvFile.limit(10).select("DEST_COUNTRY_NAME", "count")
.write.partitionBy("count").text("/tmp/five-csv-files2.csv")

网友评论

本文标题：Spark结构化API数据源——文本文件

本文链接：https://www.haomeiwen.com/subject/jzsihltx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！