美文网首页
2.spark 读取流数据

2.spark 读取流数据

作者: 一杭oneline | 来源:发表于2020-04-04 20:07 被阅读0次
package com.sparktest.bigdata.spark

import org.apache.spark.{SparkConf, SparkContext}
import org.apache.spark.SparkContext
import org.apache.spark.streaming.StreamingContext
import org.apache.spark.streaming.Seconds
object Driver02 {
  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setMaster("local[2]").setAppName("stream")
    val sc = new SparkContext(conf)
    val ssc = new StreamingContext(sc,Seconds(5))
    //seconds batch 大小 5秒

    //为了实现历史批次数据的累加,需要指定检查点目录
    //可以是本机也可HDFS
    ssc.checkpoint(directory = "d:/data/check")
    val data = ssc.textFileStream("hdfs://192.168.56.101:9000/stream/")
    //val  data2 = sc.textFile("hdfs://192.168.56.101:9000/stream")
    val r1 = data.flatMap(_.split(" ")).map((_, 1))
    val r2=r1.reduceByKeyAndWindow((a:Int,b:Int)=>a+b,Seconds(5),Seconds(5)) // 窗口和间隔
    //val r2 = r1.updateStateByKey((seq: Seq[Int], option: Option[Int]) => Some(seq.sum + option.getOrElse(0)))
    r2.print()
    ssc.start
    ssc.awaitTermination
  }
}

相关文章

  • 2.spark 读取流数据

  • socket

    读取数据流的时候, 不可重复, 顺序读取

  • java输入IO流

    1.输入流和输出流 -输入流:只能从中读取数据,不能向其写入数据-输出流:只能向其写入数据,不能从中读取数据 这里...

  • 08.IO流的分类

    IO流分类: 流向输入流 读取数据 FileReader Reader输出流 写出数据 FileWr...

  • java之IO流

    输入流:将外设中的数据读取到内存中输出流:将内存中的数据读取到外设中 字符流的由来:其实就是字节流读取文字字节数据...

  • JavaSE总结(9)IO流(1)

    一、IO流: IO流: input输入(流向内存) 读取数据 output输出(流出内存) 写出数据 IO...

  • 2020-06-30【字符流】

    字节缓冲流 字符流 编码表 字符流写数据的5中方式 字符流读取数据的2种方式 练习 字符缓冲流 IO流小结

  • 编程体系结构(04):JavaIO流文件管理

    一、IO流分类 1、分类角度 流的方向 输入流:从数据源中读取数据到应用中的流; 输出流:从应用中将数据写入到目的...

  • 2018-12-27

    一、IO流分类: (一)按流向分类 1.输入流 读取数据 FileReader Reader 2.输出流 写出数据...

  • 2018-05-19(IO流)

    IO流概述:用于传输数据 分类: 按流向分: 输入流:读取数据; 输出流:写出数据; 按操作分: 字节流:以字节为...

网友评论

      本文标题:2.spark 读取流数据

      本文链接:https://www.haomeiwen.com/subject/jlrsphtx.html