2023-03-02- spark union数目过大导致超过s

作者: 破阵子沙场秋点兵 | 来源:发表于2023-03-01 18:17 被阅读0次

以 web-view 嵌入在小程序中 h5 页面，如何处理附件下
hive调优
AQE中的CoalesceShufflePartitions和O
减法还是简法
Spark History Server自动删除日志文件
Spark on k8s: 调试Executor Pod的方法
sparksql读parquet表执行报错
The world in brief, March 13th 2
（一）Spark SQL三种方式启动
A brief introduction to Spark Au

原理可以参考 https://blog.csdn.net/monkeyboy_tech/article/details/122008124

解决方案参考 https://blog.csdn.net/jane3von/article/details/110841858

把每个Dataset在经过spark sql执行之后需要coalesce(1),然后经过union之后，会有1000个分区数据，再重分区20。而且要用sparkContext （sc）里面的union算子，而不能使用dataset的union算子，那样会有无数次的union，而用sc会一次union起来。
————————————————
版权声明：本文为CSDN博主「jane3von」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/jane3von/article/details/110841858

网友评论

本文标题：2023-03-02- spark union数目过大导致超过s

本文链接：https://www.haomeiwen.com/subject/ljkdldtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

2023-03-02- spark union数目过大导致超过s

相关文章

以 web-view 嵌入在小程序中 h5 页面，如何处理附件下

hive调优

AQE中的CoalesceShufflePartitions和O

减法还是简法

Spark History Server自动删除日志文件

Spark on k8s: 调试Executor Pod的方法

sparksql读parquet表执行报错

The world in brief, March 13th 2

（一）Spark SQL三种方式启动

A brief introduction to Spark Au

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读