美文网首页
Spark Shuffle落地文件

Spark Shuffle落地文件

作者: clive0x | 来源:发表于2019-06-28 21:22 被阅读0次

每个map task落地两文件:data和index

shuffle_${shuffle_id}_${map_id}_0.data和shuffle_${shuffle_id}_${map_id}_0.index

获取时,取datafile [indexfile[blockid.reduceid*8L],(indexfile[blockid.reduceid + 1)*8L]]区间数据。

相关文章

网友评论

      本文标题:Spark Shuffle落地文件

      本文链接:https://www.haomeiwen.com/subject/rvkycctx.html