Spark知识的记录,知识来自官网资料、书籍、以及自己开发中的积累
RDD的定义 RDD是分布式内存的一个抽象概念,是一种高度受限的内存模型,即RDD是只读的记录分区的集合,能横跨集...[作者空间]
Spark运行架构图 重要概念 Client 客户端进程,负责提交作业 Application 提交一个作业就是一...[作者空间]