关于Spark中的常见问题及解决方法(3) —— Aggrega

关于Spark中的常见问题及解决方法(3) —— Aggrega

作者: LestatZ | 来源:发表于2019-03-30 11:12 被阅读0次

关于Spark中的常见问题及解决方法(3) —— Aggrega
关于Spark中的常见问题及解决方法(5) ——Driver O
青桐教育：色彩考试中常见问题及解决方法
解决 warning: directory not found
T区常见问题和T区常见问题解决方法，七老总经销小赖
2.关于Apache Spark
IOS蓝牙开发遇到问题？不慌，看看本文收集的问题能否为你提供解决
如何说孩子才会听，怎么听孩子才肯说
费曼一下今天学习的关于升级学习力的知识
9.Spark Streaming

前言

如果你程序中的聚合速度较慢，请先查看 Spark Stragglers/任务执行缓慢部分。

主要症状

在执行 groupby 操作时，任务执行缓慢
聚合操作的后序操作也很缓慢

可能的原因

这类问题并没有固定的解决方法。有时候，由于作业中的数据有一些偏斜的键(即数据倾斜)，导致作业执行缓慢。

可能的解决方法

在聚合之前增加分区数量可能有助于减少每个任务中处理的不同键的数量。
增加Executor的内存也可以帮助缓解这个问题。如果键有大量数据，这将允许Executor尽量在内存内进行计算而避免溢出到磁盘。
如果聚合之后的任务也很慢，这意味着聚合后的数据集可能仍然不平衡。尝试插入重新分区调用以随机分区。
在聚合操作之前使用SELECT等操作过滤选出需要处理的数据，避免处理无关的数据。 Spark的查询优化器将自动为结构化API执行此操作。
确保数据中的空值被正确表示（使用Spark的null概念）而不是像”“或”EMPTY“那样的默认值。 Spark通常会尽可能优化，在作业早期跳过空值，但对于其他自定义的占位符值，并没有这样的优化机制
有些聚合函数本身也比其他函数慢。例如，collect_list 和 collect_set 是非常慢的聚合函数，因为它们必须将所有匹配的对象返回给驱动程序，应该在性能关键代码中避免使用。

参考资料

[BOOK] Spark - The Definitive Guide

相关文章

关于Spark中的常见问题及解决方法(3) —— Aggrega
前言如果你程序中的聚合速度较慢，请先查看 Spark Stragglers/任务执行缓慢部分。主要症状在执行...
关于Spark中的常见问题及解决方法(5) ——Driver O
前言 Driver OutOfMemoryError或Driver Unresponsive是一个非常严重的问题，...
青桐教育：色彩考试中常见问题及解决方法
小编给大家整理了一些关于色彩考试中的常见问题、解决方法等。
解决 warning: directory not found
一.常见问题及解决方法(也是网上最多的): 问题: "directory not found for option...
T区常见问题和T区常见问题解决方法，七老总经销小赖
T区常见问题和T区常见问题解决方法 T区常见问题和T区常见问题解决方法 T区常见问题和T区常见问题解决方法 T区常...
2.关于Apache Spark
关于Apache Spark 1 Why Apache Spark2 关于Apache Spark3 如何安装Ap...
IOS蓝牙开发遇到问题？不慌，看看本文收集的问题能否为你提供解决
在上一篇《Android BLE开发常见问题及解决方法》文章中我相信帮助了很多的小伙伴,那么在这篇《iOS BLE...
如何说孩子才会听，怎么听孩子才肯说
第5章赞赏孩子的建议及常见问题 1、读书收获：课程中对我最有触动的3句话。 ***关于赞赏的注意事项： ①确认...
费曼一下今天学习的关于升级学习力的知识
今天学习了移动互联网时代关于成人学习的两各常见问题及解决方法 1、干货知识收集癖 2、习惯性质疑什么是干货收集癖...
9.Spark Streaming
Spark Streaming 1 Why Apache Spark2 关于Apache Spark3 如何安装A...

网友评论

Spark学习笔记

本文标题：关于Spark中的常见问题及解决方法(3) —— Aggrega

本文链接：https://www.haomeiwen.com/subject/qijjbqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Spark学习笔记

热点阅读

Spark学习笔记

关于我们|服务条款|联系我们|关于Spark中的常见问题及解决方法(3) —— Aggrega|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！