美文网首页
Spark广播变量

Spark广播变量

作者: 夜空最亮的9星 | 来源:发表于2018-08-07 17:27 被阅读5次

原文链接

import org.apache.spark.{SparkConf, SparkContext}

import scala.collection.mutable

object SparkTest {

  def main(args: Array[String]): Unit = {

    val conf = new SparkConf().setAppName("SparkTest").setMaster("local[2]")

    val sc = new SparkContext(conf)

    val fileRdd = sc.parallelize(Array(("imsi1","2018-07-29 11:22:23","zd-A"),("imsi2","2018-07-29 11:22:24","zd-A"),("imsi3","2018-07-29 11:22:25","zd-A")))
    val result = mutable.Map.empty[String,String]
    val resultBroadCast = sc.broadcast(result)

    fileRdd.foreach(input=>{
      val str = (input._1+"\t"+input._2+"\t"+input._3).toString;
      resultBroadCast.value += (input._1.toString -> str)
    })

    resultBroadCast.value.foreach(println(_))

    sc.stop()
    
  }

}

相关文章

  • Spark-broadcast

    参见Spark相关--共享变量-广播变量-broadcast

  • spark广播变量

  • Spark广播变量

    原文链接

  • Spark—广播变量

    广播变量 Spark有两种共享变量——累加器、广播变量。广播变量可以让程序高效地向所有工作节点发送一个较大的只读值...

  • spark广播变量

    广播变量的好处:如果你的算子函数中,使用到了特别大的数据,那么,这个时候,推荐将该数据进行广播。这样的话,就不至于...

  • Spark的广播变量机制

    Spark广播变量 什么是广播变量? 在同一个Execute共享同一份计算逻辑的变量 广播变量使用场景 我现在要在...

  • spark使用广播变量

  • Spark 之广播变量

    1. Background Spark 中有两种共享变量,其中一个是累加器,另一个是广播变量。前者解决了 Spar...

  • Spark广播变量应用

    一、广播变量 1、广播变量的优点 不需要每个task带上一份变量副本,而是变成每个节点的executor存一份副本...

  • Spark之广播变量

    什么是广播变量 广播变量:分布式共享只读变量。广播变量用来高效分发较大的对象。向所有工作节点发送一个较大的只读值,...

网友评论

      本文标题:Spark广播变量

      本文链接:https://www.haomeiwen.com/subject/nlvavftx.html