最近在看SPARK,跟着慕课网上的视频操作,感觉跟老师讲的一模一样,但就是打印不出结果。
val rdd=sc.parallelize(Array(1,2,3,3))
rdd.foreach(println)
打印后无任何显示,很奇怪。
后来查了下,是因为数据分发到不同节点上,打印在各节点的显示上,
解决方法有两种:
一。
rdd.collect.foreach(println)
结果:
1
2
3
3
这里的collect()方法的作用是收集分布在各个worker的数据到driver节点。
二。
rdd.take(3).foreach(println)
结果:
1
2
3
参考:
https://blog.csdn.net/qq_34872215/article/details/107638622
网友评论