美文网首页
(转)断点调试spark程序

(转)断点调试spark程序

作者: mcdull_zhang | 来源:发表于2018-08-06 18:02 被阅读0次

原文地址

简介

    由于spark有多种运行模式,远程调试的时候,虽然大体步骤相同,但是还是有小部分需要注意的地方,这里记录一下调试运行在spark on yarn模式下的程序。

环境准备

    需要完好的Hadoop,spark集群,以便于提交spark on yarn程序。我这里是基于CDH的环境

步骤

    1. 随便写个spark程序,比如序列化一个集合,然后求和。然后使用maven打包,上传至集群。可以先提交运行一次,确保可以运行成功

    2. 要让远程的spark程序停下来。有两种方式,一种需要修改配置文件,个人不喜欢这种强侵入的做法,所以只用下面这种简单的不用修改任何东西的方式

    3. 在spark提交程序命令中加入参数:--driver-java-options "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=8787",其中端口可以自己随便定义,别选常用的以免重复即可。例如我的提交命令:spark-submit --class cn.spark.study.core.ParallelizeCollection --master yarn-cluster --num-executors 3 --executor-cores 2 --executor-memory 1G --driver-java-options "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=y,address=8787" /home/spark-study-scala-0.0.1-SNAPSHOT-jar-with-dependencies.jar

    4. 在IDEA中配置远程调试

        ①找到工具栏,点击:RUN  ->   Edit Configurations    

        ②添加配置

添加配置

        ③输入远程主机的地址和端口号(与命令脚本中的端口号要一致),应用确定

具体配置

    5. 然后在主面板上,选择自己刚刚添加的配置,然后点击debug按钮。

开始debug

相关文章

  • (转)断点调试spark程序

    原文地址 简介 由于spark有多种运行模式,远程调试的时候,虽然大体步骤相同,但是还是有小部分需要注意的地方,这...

  • linux编程入门(七)-使用gdb调试程序

    程序开发离不开调试,可以断点调试,也可以打log调试,linux下断点调试c,c++程序用gdb。 断点调试虽然很...

  • Java基础语法_Day12

    一、Eclipse断点调试 Eclipse断点调试概述 Eclipse的断点调试可以查看程序的执行流程和解决程序中...

  • Pyspark的Intellij idea环境搭建

    为什么需要IDE 在本地搭建一个spark环境可以方便spark代码的调试,可以和一般程序一样打断点,看变量,否则...

  • spark断点调试

    断点调试 参考:http://danosipov.com/?p=779 测试代码 IntelliJ Idea 生成...

  • 代码调试

    过去调试JavaScript的方式 alert() console.log() 断点调试 断点调试是指自己在程序的...

  • IDEA远程调试Spark

    1.前言 本文讲述如何使用IDEA远程调试spark,这里所说的调试spark包括: 调试spark应用程序,也就...

  • idea调试spark断点设置无效的问题

    今天调试spark(read分支),设置断点,debug运行,就是不能在断点的地方停止运行。但是,我能非常肯定,代...

  • spark应用调试(idea 环境)

    spark应用调试(idea 环境) spark shell可以比较方便的分步执行调试spark应用程序,但有时候...

  • Intellij调试程序

    debug:不要让程序一闪而过 设置断点, debug调试模式运行程序 断点( breakpoint ) : 可以...

网友评论

      本文标题:(转)断点调试spark程序

      本文链接:https://www.haomeiwen.com/subject/bjbgvftx.html