Spark报错：java.io.notserializablee

作者: Victor_bigdata | 来源:发表于2019-06-12 19:34 被阅读0次

Spark报错：java.io.notserializablee
NoClassDefFoundError: org/slf4j/
使用spark-sql报错 “Metastore contain
spark.submit.deployMode=client时，
Spark3.1.1 ERROR AsyncEventQueu
spark报错
spark 报错
spark报错
spark报错
intellij 调试spark scala 程序报错处理

Exception in thread "main" org.apache.spark.SparkException: Task not serializable
    at org.apache.spark.util.ClosureCleaner$.ensureSerializable(ClosureCleaner.scala:304)
    at org.apache.spark.util.ClosureCleaner$.org$apache$spark$util$ClosureCleaner$$clean(ClosureCleaner.scala:294)
    at org.apache.spark.util.ClosureCleaner$.clean(ClosureCleaner.scala:122)
    at org.apache.spark.SparkContext.clean(SparkContext.scala:2021)
    at org.apache.spark.rdd.RDD$$anonfun$foreach$1.apply(RDD.scala:889)
    at org.apache.spark.rdd.RDD$$anonfun$foreach$1.apply(RDD.scala:888)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:147)
    at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:108)
    at org.apache.spark.rdd.RDD.withScope(RDD.scala:306)
    at org.apache.spark.rdd.RDD.foreach(RDD.scala:888)
    at com.test.spark.hbase.RunReadLogByKafka$$anonfun$main$1.apply(RunReadLogByKafka.scala:38)
    at com.test.spark.hbase.RunReadLogByKafka$$anonfun$main$1.apply(RunReadLogByKafka.scala:35)
    at org.apache.spark.streaming.dstream.DStream$$anonfun$foreachRDD$1$$anonfun$apply$mcV$sp$3.apply(DStream.scala:631)
    at org.apache.spark.streaming.dstream.DStream$$anonfun$foreachRDD$1$$anonfun$apply$mcV$sp$3.apply(DStream.scala:631)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1$$anonfun$apply$mcV$sp$1.apply$mcV$sp(ForEachDStream.scala:42)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1$$anonfun$apply$mcV$sp$1.apply(ForEachDStream.scala:40)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1$$anonfun$apply$mcV$sp$1.apply(ForEachDStream.scala:40)
    at org.apache.spark.streaming.dstream.DStream.createRDDWithLocalProperties(DStream.scala:399)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1.apply$mcV$sp(ForEachDStream.scala:40)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1.apply(ForEachDStream.scala:40)
    at org.apache.spark.streaming.dstream.ForEachDStream$$anonfun$1.apply(ForEachDStream.scala:40)
    at scala.util.Try$.apply(Try.scala:161)
    at org.apache.spark.streaming.scheduler.Job.run(Job.scala:34)
    at org.apache.spark.streaming.scheduler.JobScheduler$JobHandler$$anonfun$run$1.apply$mcV$sp(JobScheduler.scala:207)
    at org.apache.spark.streaming.scheduler.JobScheduler$JobHandler$$anonfun$run$1.apply(JobScheduler.scala:207)
    at org.apache.spark.streaming.scheduler.JobScheduler$JobHandler$$anonfun$run$1.apply(JobScheduler.scala:207)
    at scala.util.DynamicVariable.withValue(DynamicVariable.scala:57)
    at org.apache.spark.streaming.scheduler.JobScheduler$JobHandler.run(JobScheduler.scala:206)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
    at java.lang.Thread.run(Thread.java:745)
Caused by: java.io.NotSerializableException: org.apache.spark.SparkContext
Serialization stack:

个人场景：

在遍历hive表数据时通过某个字段去获取hbase中特定字段的值，结合hive表中的一些字段再整合为一条数据，保存到hive表中

原因：

在rdd.map()中再次调用了一次otherRdd的操作，然而spark是不支持rdd.嵌套使用

解决：通过多个rdd 再进行join操作

个人场景解决方案：

rdd1获取到所有hive表数据（包含hbase查询所需rowKey字段）存入临时表a
rdd2 获取hbase表中rowKey字段和需要的字段信息存入临时表b
spark.sql ("insert overwrite table abc_database.cde_table select * from a letf join b on a.rowKey=b.rowKey")

网友评论

本文标题：Spark报错：java.io.notserializablee

本文链接：https://www.haomeiwen.com/subject/xbsrfctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Spark报错：java.io.notserializablee

个人场景：

原因：

解决：通过多个rdd 再进行join操作

个人场景解决方案：

相关文章

Spark报错：java.io.notserializablee

NoClassDefFoundError: org/slf4j/

使用spark-sql报错 “Metastore contain

spark.submit.deployMode=client时，

Spark3.1.1 ERROR AsyncEventQueu

spark报错

spark 报错

spark报错

spark报错

intellij 调试spark scala 程序报错处理

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读