1-SparkSubmit源码阅读

作者: windydreams | 来源:发表于2022-04-16 15:57 被阅读0次

1-SparkSubmit源码阅读
iOS 系统源码及第三方源码总结
【源码阅读】Glide源码阅读之with方法（一）
etcd-raft 库源码阅读【WIP】
HotSpot源码构建调试
Java8 源码阅读 - AQS之Condition
Java多线程——ReentrantReadWriteLock源
SpringBoot 源码解析--搭建
搭建Kafka源码阅读环境
Mybatis源码学习(1)--SqlSessionFactor

本文基于spark2.4.7, 梳理SparkSubmit.scala的提交应用的核心流程，流程如下图1所示，具体请阅读源码。
先从一段脚本说起，下面是一段提交spark应用的jar包的脚本

!/bin/bash

echo '数据分析模块启动------------'
echo "PID of this script: $$"
redisHost=192.168.1.212
redisPort=6379
redisPass=xxx
redisIndex=8
intervalTime=5
brokers=192.168.1.212:9092
spark-submit --class com.my.handler.XXXDataHandler
--master spark://XMaster:7077
--deploy-mode client
--driver-memory 512m
--executor-memory 1024m
--total-executor-cores 1
--executor-cores 1
/home/hadoop/spark/mms/mms-analyze-2.0-SNAPSHOT-jar-with-dependencies.jar
$redisHost$ redisPort $redisPass$ redisIndex $intervalTime$ brokers

这个脚本调用的就是/bin目录下的spark-submit脚本

查看spark-submit文件里面有一段核心的代码，说明SparkSubmit 是脚本提交到入口，对应spark源码core包下的SparkSubmit .scala文件
exec " ${SPARK_HOME}"/bin/spark-class org.apache.spark.deploy.SparkSubmit "$ @"