美文网首页
157、Spark内核原理进阶之join算子内部实现原理

157、Spark内核原理进阶之join算子内部实现原理

作者: ZFH__ZJ | 来源:发表于2019-01-24 11:50 被阅读0次
    join.png

    join算子的原理

    1. cogroup,聚合两个rdd的key
    2. flatMap,聚合后的每条数据,都可能返回多条数据
      将每个key对应的两个集合的所有元素,做了一个笛卡尔积

    相关文章

      网友评论

          本文标题:157、Spark内核原理进阶之join算子内部实现原理

          本文链接:https://www.haomeiwen.com/subject/rptljqtx.html