每个map task落地两文件:data和index
shuffle_${shuffle_id}_${map_id}_0.data和shuffle_${shuffle_id}_${map_id}_0.index

获取时,取datafile [indexfile[blockid.reduceid*8L],(indexfile[blockid.reduceid + 1)*8L]]区间数据。
每个map task落地两文件:data和index
shuffle_${shuffle_id}_${map_id}_0.data和shuffle_${shuffle_id}_${map_id}_0.index
获取时,取datafile [indexfile[blockid.reduceid*8L],(indexfile[blockid.reduceid + 1)*8L]]区间数据。
本文标题:Spark Shuffle落地文件
本文链接:https://www.haomeiwen.com/subject/rvkycctx.html
网友评论