大数据学习
看到一些同学的Spark代码中包含了很多repartition的操作,有一些不是很合理,非但没有增加处理的效率,反...[作者空间]
repartitionAndSortWithinPartitions算是一个高效的算子,是因为它要比使用repar...[作者空间]