使用spark中趟过的坑
RDD,即Resilient Distributed Dataset,是Spark的核心概念。这篇文章就是讲讲sp...[作者空间]
最近下载了个CDH的quickstart vm玩玩,发现个问题,spark 的Job History Server...[作者空间]
生产环境中碰到一个问题是spark的history server日志满了 org.apache.hadoop.ip...[作者空间]