本文适用于Kafka broker 0.8.2.1及更高版本。 这里会说明如何配置Spark Streaming接...[作者空间]
缓存/持久化 和RDD类似,DStream允许开发者将流数据持久化到内存。使用在DStream上使用persist...[作者空间]
DStreams转换(Transformation) 和RDD类似,转换中允许输入DStream中的数据被修改。D...[作者空间]
链接 和Spark类似,Spark Streaming通过Maven Central提供。为编写Spark Str...[作者空间]
概述 Spark Streaming是核心Spark API的扩展,对实时数据流地处理具有可扩展,高吞吐量和容错特...[作者空间]
共享变量 通常,当一个函数传递给在远程集群节点上执行的Spark操作(如map或reduce)时,函数使用的是所有...[作者空间]
弹性分布式数据集(RDDs) Spark围绕着弹性分布式数据集(RDD)这个概念,RDD是具有容错机制的元素集合,...[作者空间]
概述 总体来说,每个Spark应用程序都包含一个驱动程序,运行了用户的main函数并且在集群上执行多种并行操作。S...[作者空间]
本文是一个如何使用Spark的简要教程。首先通过Spark的交互式Shell来介绍API(使用Python或Sca...[作者空间]
注:1. 本文链接中,包含[]的为已翻译的文档链接,不包含的为官方文档链接。2. 涉及到编程语言的部分,以翻译Sc...[作者空间]