1.5.1.4 Spark算子详解(总览)

1.5.1.4 Spark算子详解(总览)

作者: 寒暄_HX | 来源:发表于2020-03-29 17:19 被阅读0次

1.5.1.4 Spark算子详解(总览)
Spark常用算子详解 2020-05-07
Spark系列 —— 算子详解（二）
16.Spark Streaming源码解读之数据清理机制解析
【Spark】RDD操作详解1——Transformation和
Spark总览
spark之旅-3.spark-core RDD算子
Spark算子总结版
（转）Spark常用算子讲解
spark学习

总目录：https://www.jianshu.com/p/e406a9bc93a9

Hadoop - 子目录：https://www.jianshu.com/p/9428e443b7fd

算子的分类

从大方向来说，算子有两种类型，对应着sparkRDD的两种操作--转换类型操作和动作类型操作。也就是：

Transformation
转换类型操作，这种变换并不触发提交作业，完成作业中间过程处理。
Transformation算子是延迟计算的，也就是说从一个RDD 转换生成另一个 RDD 的转换操作不是马上执行，需要等到有 Action 操作的时候才会真正触发运算。
Action
动作类型操作，这类算子会触发 SparkContext 提交 Job 作业。
Action 算子会触发 Spark 提交作业，并将数据输出 Spark系统。

如果在细致划分一下，转换类型算子由两种类型：针对于value数据的Transformation算子和针对K-V数据的Transformation算子。

Value数据类型的Transformation算子

输入分区与输出分区一对一型

map算子
flatMap算子
mapPartitions算子
glom算子

输入分区与输出分区多对一型

union算子
cartesian算子

输入分区与输出分区多对多型

grouBy算子

输出分区为输入分区子集型

filter算子
distinct算子
subtract算子
sample算子
takeSample算子

Cache型

cache算子
persist算子

Key-Value数据类型的Transfromation算子

输入分区与输出分区一对一

mapValues算子

对单个RDD或两个RDD聚集

单个RDD聚集

combineByKey算子
reduceByKey算子
partitionBy算子

两个RDD聚集

Cogroup算子

连接

join算子
leftOutJoin和 rightOutJoin算子

Action算子

无输出

foreach算子

HDFS

saveAsTextFile算子
saveAsObjectFile算子

聚合算子

collect算子
collectAsMap算子
reduceByKeyLocally算子
lookup算子
count算子
top算子
reduce算子
fold算子
aggregate算子

相关文章

1.5.1.4 Spark算子详解(总览)
总目录：https://www.jianshu.com/p/e406a9bc93a9 Hadoop - 子目录：h...
Spark常用算子详解 2020-05-07
Spark常用算子详解 Spark的算子的分类从大方向来说，Spark 算子大致可以分为以下两类: 1）Tran...
Spark系列 —— 算子详解（二）
前言本文接上一篇 Spark系列 —— 各类算子详解（一）这篇主要来讲讲 Action 算子以及 Cache...
16.Spark Streaming源码解读之数据清理机制解析
本期内容：一、Spark Streaming 数据清理总览二、****Spark Streaming ****数据...
【Spark】RDD操作详解1——Transformation和
Spark算子的作用下图描述了Spark在运行转换中通过算子对RDD进行转换。算子是RDD中定义的函数，可以对...
Spark总览
什么是Spark Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark扩展了广泛使用的MapRe...
spark之旅-3.spark-core RDD算子
Spark-core Spark-core RDD算子，思维导图
Spark算子总结版
Spark的算子的分类从大方向来说，Spark 算子大致可以分为以下两类: 1）Transformation 变...
（转）Spark常用算子讲解
Spark的算子的分类从大方向来说，Spark 算子大致可以分为以下两类: 1）Transformation 变...
spark学习
spark比较重要的算子：

网友评论

本文标题：1.5.1.4 Spark算子详解(总览)

本文链接：https://www.haomeiwen.com/subject/tueuuhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|1.5.1.4 Spark算子详解(总览)|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！