美文网首页
一份超详细的 Spark 入门介绍

一份超详细的 Spark 入门介绍

作者: 大数据技术架构 | 来源:发表于2019-07-18 07:55 被阅读0次

Apache Spark 是 UC Berkeley AMP Lab 开源的类 Hadoop MapReduce 的通用并行框架,是专为大规模数据处理而设计的快速通用的计算引擎。

Spark 是目前最流行的批流统一的大数据处理平台。Spark 自 2014 年发布 1.2 版本以来,已经成为了大数据领域不可或缺的计算组件,近几年发展迅速,社区非常活跃。Spark 已经形成了一套自己的生态圈,主要包括 Spark SQL 批处理/交互式查询,Spark Streaming 流式计算,GraphX 和 MLlib 提供常用的图计算和机器学习算法。

截至目前,Spark 最新发布版本为 2.4.3。

本文来自近期的一次 Spark 内部分享,内容主要包括 Spark RDD 的重点介绍, 以及 Spark 核心模块 DAGScheduler、TaskScheduler、BlockManager 等讲解,内容充实。如下

  • Spark简介及总体流程

  • Spark核心模块的实现

  • Spark应用库

  • Spark与Hadoop的区别与联系

  • Spark应用

关注本微信公众号并回复 0705 即可获取完整 PPT。内容:

image image image image image image image image image.png image image image image image image image image image image image image image image image image image image image image image image image image

往期文章精选

Apache Hudi 0.5.1版本重磅发布

贝壳找房基于 Flink 的实时平台建设

网易基于 HBase 的最佳实践

小米流式平台架构演进与实践

如果您喜欢这篇文章,点【在看】与转发都是一种鼓励,期待得到您的认可 ❥(^_-)

相关文章

  • 一份超详细的 Spark 入门介绍

    Apache Spark 是 UC Berkeley AMP Lab 开源的类 Hadoop MapReduce...

  • Redis入门教程

    来源:脚本之家 这篇文章主要介绍了超强、超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需...

  • 超强、超详细Redis数据库入门教程

    来源:脚本之家 这篇文章主要介绍了超强、超详细Redis入门教程,本文详细介绍了Redis数据库各个方面的知识,需...

  • MyBatis

    MyBatis学习总结(一)——MyBatis快速入门 超详细MyBatis入门讲解

  • Spark内核流程概要

    本篇文章主要介绍Spark的内核架构,详细介绍从Saprk程序编写完成使用Spark submit(shell)的...

  • Spark快速入门

    Spark快速入门 本教程提供了如何使用 Spark 的简要介绍。首先通过运行 Spark 交互式的 shell(...

  • Spark 基础(下篇)

    上篇介绍了spark的突出特点以及基本框架,下面给大家介绍下spark的基本数据结构、spark任务调度的详细流程...

  • Spark入门介绍

    Spark自从2014年1.2版本发布以来,已成为大数据计算的通用组件。网上介绍Spark的资源也非常多,但是不利...

  • Spark入门介绍

    前言 Spark自从2014年1.2版本发布以来,已成为大数据计算的通用组件。网上介绍Spark的资源也非常多,但...

  • Centos7 环境下 Standalone Spark 安装配

    1. Spark简介 详细的spark框架功能和使用介绍,可参考SPARK官网文档 2. Centos7环境配置 ...

网友评论

      本文标题:一份超详细的 Spark 入门介绍

      本文链接:https://www.haomeiwen.com/subject/vbtklctx.html