reduceByKey:按照key进行聚合,在shuffle之前有个聚合操作,返回结果是RDD【k,v】
groupByKey:按照key进行分组,直接进行shuffle
开发指导:建议使用reduceByKey,但需要注意是否会影响业务逻辑
reduceByKey:按照key进行聚合,在shuffle之前有个聚合操作,返回结果是RDD【k,v】
groupByKey:按照key进行分组,直接进行shuffle
开发指导:建议使用reduceByKey,但需要注意是否会影响业务逻辑
本文标题:reduceByKey与groupByKey的区别
本文链接:https://www.haomeiwen.com/subject/lvbhpctx.html
网友评论