agrregate的简化版。分区内和分区间计算规则一致。
当前的初始值不仅在分区内有效,在分区间仍然有效。
package com.atguigu
import org.apache.spark.rdd.RDD
import org.apache.spark.{SparkConf, SparkContext}
object Action {
def main(args: Array[String]): Unit = {
val conf: SparkConf = new SparkConf().setMaster("local[*]").setAppName("ADCount")
val sc = new SparkContext(conf)
val rdd: RDD[Int] = sc.makeRDD(List(1,2,3,4,5,6),2)
val i: Int = rdd.fold(10)(_+_)
println(i)
}
}
51
网友评论