美文网首页
数据清洗

数据清洗

作者: 扣篮的左手 | 来源:发表于2018-08-04 22:07 被阅读0次
    import org.apache.spark.sql.SparkSession
    object DataCleaning {
      def main(args: Array[String]): Unit = {
        val spark = SparkSession.builder().appName("DataCleaning")
          .master("local[2]").getOrCreate()
    
        val access = spark.sparkContext.textFile("file:///f:/access.txt")
    
        access.foreach(println)
    
        access.map(line => { line
          val splits = line.split(" ");
          splits(0) //取出IP地址
        }).foreach(println)
        spark.stop()
      }
    }
    

    相关文章

      网友评论

          本文标题:数据清洗

          本文链接:https://www.haomeiwen.com/subject/eqppvftx.html