- 154、Spark内核原理进阶之distinct算子内部实现原理
- 157、Spark内核原理进阶之join算子内部实现原理
- 151、Spark内核原理进阶之union算子内部实现原理
- 155、Spark内核原理进阶之cogroup算子内部实现原理
- 160、Spark内核原理进阶之coalesce算子内部实现原理
- 152、Spark内核原理进阶之groupByKey算子内部实现
- 156、Spark内核原理进阶之intersection算子内部
- 159、Spark内核原理进阶之cartesian算子内部实现原
- 158、Spark内核原理进阶之sortByKey算子内部实现原
- 153、Spark内核原理进阶之reduceByKey算子内部实
distinct算子的原理
- 首先,自己先给每个值打上一个v2,变成一个tuple
- reduceByKey(...仅仅返回一个value)
- 将去重后的数据,从tuple还原为单值
网友评论