美文网首页
run spark on yarn

run spark on yarn

作者: xncode | 来源:发表于2017-08-11 14:20 被阅读0次

    需要HADOOP_CONF_DIR YARN_CONF_DIR环境变量,用于写入数据到hdfs和连接到yarn的resourcemanager。

    启动方式同样有两种:

    cluster mode 在yarn集群中的一个进程中运行,客户进程可以结束。
    client mode 在客户进程中运行,只是从yarn中获取资源

    yarn的地址是通过配置文件获得的,启动时只需要传递 --yarn即可

    ./bin/spark-submit --class path.to.your.Class --master yarn --deploy-mode cluster [options] <app jar> [app options]
    

    例如

    ./bin/spark-submit --class org.apache.spark.examples.SparkPi \
    --master yarn \
    --deploy-mode cluster \
    --driver-memory 4g \
    --executor-memory 2g \
    --executor-cores 1 \
    --queue thequeue \
    lib/spark-examples*.jar \
    10
    
    ./bin/spark-shell --master yarn --deploy-mode client
    
    ./bin/spark-submit --class my.main.Class \
    --master yarn \
    --deploy-mode cluster \
    --jars my-other-jar.jar,my-other-other-jar.jar \
    my-main-jar.jar \
    app_arg1 app_arg2
    

    相关文章

      网友评论

          本文标题:run spark on yarn

          本文链接:https://www.haomeiwen.com/subject/mgelrxtx.html