美文网首页
大数据之Spark

大数据之Spark

作者: 枫叶无言_1997 | 来源:发表于2021-02-06 17:58 被阅读0次

    spark下载地址: https://archive.apache.org/dist/spark/

    一、配置Spark环境变量及将jars中 以下jar包拷贝至hive lib目录中
    spark-core_2.12-3.0.0.jar
    spark-kvstore_2.12-3.0.0.jar 
    spark-launcher_2.12-3.0.0.jar 
    spark-network-common_2.12-3.0.0.jar
    spark-network-shuffle_2.12-3.0.0.jar 
    spark-tags_2.12-3.0.0.jar 
    spark-unsafe_2.12-3.0.0.jar

    二、在Hive中创建spark配置文件 
    1、vim /opt/module/hive/conf/spark-defaults.conf  
    spark.master yarn
    spark.eventLog.enabled          true
    spark.eventLog.dir              hsfs://hadoop102:8020/spark-history spark.executor.memory          1g
    spark.driver.memory            1g 
    2、hadoop fs -mkdir /spark-history

    三、上传纯净版spark jar包至hdfs 
    1、hadoop fs -mkdir /spark-jars 
    2、hadoop fs -put /opt/module/spark-3.0.0-bin-without-hadoop/jars/*  /spark-jars

    四、修改Hive中hive-site.xml  
    <!--spark依赖包(注:端口号必须和hadoop中namenode端口号一致) -->
    <property>

    <name>spark.yarn.jars</name>

    <value>hdfs://hadoop102:8020/spark-jars/*</value>

    </property>

    <!--hive执行引擎 -->

    <property>

    <name>hive.execution.engine</name>

    <value>spark</value>

    </property>

    <!--hive和spark连接超时时间 -->

    <property>

    <name>hive.spark.client.connect.timeout</name>

    <value>10000ms</value>

    </property>

    相关文章

      网友评论

          本文标题:大数据之Spark

          本文链接:https://www.haomeiwen.com/subject/lipztltx.html