Spark本地/集群执行wordcount程序

作者: FantJ | 来源:发表于2018-11-20 09:32 被阅读15次

[

.

执行步骤

hadoop fs -put spark.txt /spark.txt
http://spark1:50070 查看

】
如果要在集群上运行，则需要修改代码中的两处：

将 setMaster() 方法删掉，他会自己去连接
将对象是本地文件改成hdfs上的文件
SparkConf conf = new SparkConf().setAppName("wordCountCluster");
JavaSparkContext sc = new JavaSparkContext(conf);
JavaRDD<String> lines = sc.textFile("hdfs://spark1:9000/spark.txt");

Spark本地/集群执行wordcount程序
[ 在spark shell中编写WordCount程序 . 执行步骤将spark.txt文件上传到hdfs上 ...
Spark之WordCount集群
本文记录用Scala编写WordCount并提交到Spark集群运行。在搭建本集群之前必须先搭建好Spark集群，...
scala基础语法
Spark核心编程wordcount程序原理深度剖析图 Spark核心编程Spark架构原理
spark wordcount
wordcount java编写spark执行 maven pom 项目结构 java代码 bash提交任务到Spark
Spark内存管理
在执行 Spark 的应用程序时，Spark 集群会启动 Driver 和 Executor 两种 JVM 进程，...
Apache Spark 内存管理详解
在执行 Spark 的应用程序时，Spark 集群会启动 Driver 和 Executor 两种 JVM 进程，...
spark源码之SparkContext
SparkContext在Spark应用程序的执行过程中起着主导作用，它负责与程序个Spark集群进行交互，包括申...
Spark核心编程：使用Java、Scala和spark-she
开发wordcount程序 1、用Java开发wordcount程序1.1 配置maven环境1.2 如何进行本地...
spark-submit 参数讲解
spark-submit 可以提交任务到 spark 集群执行，也可以提交到 hadoop 的 yarn 集群执行...
PySpark学习：WordCount排序
PySpark学习：WordCount排序环境: 1、配置好Spark集群环境 2、配置好Python环境，在s...