美文网首页
Spark Streaming

Spark Streaming

作者: clive0x | 来源:发表于2019-11-03 09:23 被阅读0次

    https://github.com/jaceklaskowski/spark-streaming-notebook/blob/master/spark-streaming-jobscheduler.adoc

    其中JobGenerator.generateJobs()有一段读源码时没看懂,receiverTracker.allocateBlocksToBatch(time)怎么和生成RDD对应?

    后面才发现对应ReceiverInputDStream compute()方法,这样前后解释就通了。Spark代码比Hadoop/Hive代码难读多了,后两者用JAVA编写,遵循JAVA设计模式,具备良好的可读性。

    JobScheduler有一个可优化参数,spark.streaming.concurrentJobs:1

    流并发任务数可优化。

    相关文章

      网友评论

          本文标题:Spark Streaming

          本文链接:https://www.haomeiwen.com/subject/vzjkbctx.html