Scala 输出CSV

作者: Reflection_ | 来源:发表于2018-03-04 05:01 被阅读0次

Scala 输出CSV
Scala WordActor第二种写法
GeoSpark---Polygon查询
Scala Actor实现异步WordCount
CSV文件的读写
2019-10-17
Scrapy输出CSV指定列顺序
pandans小技巧
python csv 格式文件中文乱码问题解决方法
mysql输出到csv

spark RDD 去括号+输出为单个CSV
rating 是 Dataframe，转为RDD

val avgs = rating.rdd
      .map( t=> (t(0),t(1)).toString().replaceAll("\\(","").replaceAll("\\)",""))
      .collect()

输出：

    printToFile(new File("Output/task1.csv")) {
      p => avgs.foreach(p.println) // 但是没有header
    }

直接对Dataframe 输出，会产生一个文件夹，下面有CSV 和 _SUCCESS

   //Create a folder
   val saveOptions = Map("header" -> "true", "path" -> "Output/Firstname_Li_task1.csv")
   rating.coalesce(1)
     .write.mode(SaveMode.Overwrite).format("csv")
     .options(saveOptions)
     .save()

   rating.write.option("header", "true").csv("Output/Firstname_Li_task1.csv")

    rating.repartition(1)
      .write.mode(SaveMode.Overwrite).format("com.databricks.spark.csv")
      .option("header", "true")
      .save("Output/Firstname_Li_task2.csv")

   rating.toJavaRDD
  .coalesce(1)
  .saveAsTextFile("Firstname_Li_task1.csv") //Create a folder

输出单个CSV，且有header

import java.io._

    def printToFile(f: java.io.File)(op: java.io.PrintWriter => Unit)
    {
      val p = new java.io.PrintWriter(f);
      p.write("asin,")
      p.write("rating_avg\n")
      try { op(p) }
      finally { p.close() }
    }

    val avgs = rating.rdd
      .map( t=> (t(0),t(1)).toString().replaceAll("\\(","").replaceAll("\\)",""))
      .collect()

    printToFile(new File("Output/Firstname_Li_task1.csv")) {
      p => avgs.foreach(p.println) // avgs.foreach(p.println)
    }

网友评论

本文标题：Scala 输出CSV

本文链接：https://www.haomeiwen.com/subject/hhitzxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Scala 输出CSV

相关文章

Scala 输出CSV

Scala WordActor第二种写法

GeoSpark---Polygon查询

Scala Actor实现异步WordCount

CSV文件的读写

2019-10-17

Scrapy输出CSV指定列顺序

pandans小技巧

python csv 格式文件中文乱码问题解决方法

mysql输出到csv

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读