美文网首页
Spark概念

Spark概念

作者: 今天比昨天努力 | 来源:发表于2020-03-16 13:08 被阅读0次

RDD

是一个基本的抽象,操作RDD就像操作一个本地集合一样,降低了编程的复杂度。

RDD的算法分为两类:一类是Transformation(lazy)、一类是Action(触发任务执行)

RDD不存在真正要计算的数据,而是记录了RDD的转换关系(调用了什么方法,传入了什么函数)

创建RDD方式:

  1 通过外部的存储系统创建RDD;

  2 将Driver的Scala集合通过并行化的方式编程RDD(试验、测试);3 调用一个已经存在的RDD的Transformation,会生成一个新的RDD

 RRD的Transformation特点

  1 lazy

  2 shengchengxinde RDD

相关文章

网友评论

      本文标题:Spark概念

      本文链接:https://www.haomeiwen.com/subject/dnfgehtx.html