美文网首页大数据CDH
CDH下安装Spark服务

CDH下安装Spark服务

作者: 小KKKKKKKK | 来源:发表于2021-06-21 08:47 被阅读0次

一、Spark是什么?

是一个基于内存计算的开源的集群计算系统,Spark 启用了内存分布数据集,除了能够提供交互式查询外,它还可以优化迭代工作负载。

二、Spark有什么用?

它取代现有生态系统中的什么? 实际上Spark不能代替任何传统的Hadoop生态系统。因为Hadoop 2,它只是另一个运行在 YARN容器 的应用程序。因此它非常适合在Hadoop生态系统。它提供可测试 可阅读 可维护等方式编程,解放了我们编写大量MapReduce工作的痛苦,而且 提高性能 。

三、基于CDH安装Spark

进入Cloudera Manager主页


image.png

选择需要安装的集群
添加服务


image.png
选择spark
image.png

继续
选择依赖


image.png
继续
选择角色
image.png
继续
配置
image.png
继续
image.png

开始安装
等待
继续


image.png
安装完成
完成

相关文章

  • CDH下安装Spark服务

    一、Spark是什么? 是一个基于内存计算的开源的集群计算系统,Spark 启用了内存分布数据集,除了能够提供交互...

  • CDH支持Spark-sql

    之前用CDH5.2进行集群的搭建,现需要将CDH支持spark-sql,具体搭建请见CDH离线安装 一:准备环境 ...

  • Ansible Role 大数据 之【cdh5-server】

    Ansible Role: cdh5 server 只安装cdh5 server服务,不安装hadoop集群。 要...

  • CDH下安装kafka服务

    一、KAFKA是什么? Kafka是由Apache软件基金会开发的一个开源流处理平台,由Scala和Java编写。...

  • CDH下安装HDFS服务

    一、HDFS是什么? Hadoop分布式文件系统[https://baike.baidu.com/item/%E5...

  • CDH下安装HBase服务

    一、HBase是什么? HBase 是一个开源的、分布式的、版本化的 NoSQL 数据库(也即非关系型数据库),它...

  • CDH下安装YARN服务

    一、YARN是什么? Apache Hadoop YARN (Yet Another Resource Negot...

  • spark配置安装

    spark配置 一. Scala安装 二. spark安装 启动spark服务:

  • CDH安装spark2

    Spark2安装 官方也提供了spark2的升级包,在CDH中spark1和spark2可以共存,但是由于scal...

  • Janusgraph spark on yarn

    一、环境说明 1.1 基于CDH5.11.1的配置安装 hadoop 2.6.0 spark 2.2.0 hbas...

网友评论

    本文标题:CDH下安装Spark服务

    本文链接:https://www.haomeiwen.com/subject/andueltx.html