《玩转Spark》专题

专题列表页

Spark 源码解析, 优化, 实战

Apache Kylin在美团数十亿数据OLAP场景下的实践
652
2016-07-24

作为公司的平台部门，需要给各个业务线提供平台的服务，那么如何建设一个满足各种需求的公司平台级OLAP分析服务呢。首...[作者空间]

深度访谈：华为开源数据格式CarbonData项目，实现大数据即
175
2016-07-24

华为宣布开源了CarbonData项目，该项目于6月3日通过Apache社区投票，成功进入Apache孵化器。Ca...[作者空间]

Phoenix 与Spark整合，完善大数据计算栈
1066
2016-07-24

本篇文章主要讲解phoenix与spark做整合，目的是将phoenix做存储，spark做计算层。这样就结合了p...[作者空间]

Spark在GrowingIO数据无埋点全量采集场景下的实践
420
2016-07-24

本文根据2016年7月北京IBM Spark沙龙上的分享讲稿整理而成。大家好，我是来自GrowingIO的数据工...[作者空间]

Spark cache 和 checkpoint
90
2016-07-15

checkpoint 相当于 cache的备胎;checkpoint的数据一般都会放在容错的文件系统当中，比如h...[作者空间]

Spark 数据倾斜解决思路
1104
2016-07-06

１．优化数据结构２．修改并行度３．对数据做采样，对数据倾斜的key增加随机的前缀．４．局部聚合＋全局聚合５...[作者空间]

Spark Streaming Transform, Actio
47
2016-06-11

[作者空间]

Spark Streaming的初始化及其关闭
42
2016-06-11

[作者空间]

spark 监控--WebUi、Metrics System
630
2016-06-10

Ui相关流程Spark集群启动之后，我们可以通过Web观查集群状态等信息，这一部分工作是Spark WebUi 模...[作者空间]

读完这100篇论文就能成大数据高手
1051
2016-06-08

作者：Anil Madan** 译者：张玉宏文源：LinkeDin 转自：CSDN**Pa...[作者空间]

Spark Streaming性能优化: 如何在生成环境下应对流
4195
2016-06-08

1、为什么引入Backpressure 默认情况下，Spark Streaming通过Receiver以生产者生产...[作者空间]

Spark Streaming性能优化: 如何获得和持续使用足够
157
2016-06-08

Yarn的使用: 运行在yarn上和其他计算框架共享资源,会有不稳定情况, hadoop 2.6推出lable-b...[作者空间]

KafkaReceiver 之timeout
14
2016-06-07

zookeeper.session.timeout.ms:该值超时的话, spark的当前kafkaReceive...[作者空间]

Spark-Streaming Windows开发环境案例搭建运
2199
2016-06-02

前言最近在专注Spark开发，记录下自己的工作和学习路程，希望能跟大家互相交流成长具体代码可参考本人GitHub...[作者空间]

基于Kafka+SparkStreaming+HBase实时点击
8466
2016-05-31

前言最近在专注Spark开发，记录下自己的工作和学习路程，希望能跟大家互相交流成长本文章更倾向于实战案例，涉及框...[作者空间]

Spark RDD数据关联过滤案例
2937
2016-05-30

前言最近在专注Spark开发，记录下自己的工作和学习路程，希望能跟大家互相交流成长QQ:86608625 微信...[作者空间]

Spark Streaming 性能优化:如何在毫秒内处理大吞吐
170
2016-06-06

解决方案[作者空间]

Spark Streaming 性能优化:安全高效的把数据保存到
718
2016-06-10

[作者空间]

改写Spark JdbcRDD，支持自己定义分区查询条件
679
2016-05-26

Spark自带的JdbcRDD，只支持Long类型的分区参数，分区必须是一个Long区间。很多情况下，这种方式都不...[作者空间]

栏目导航

延伸阅读

栏目导航

爱情美文推荐

热点爱情美文

最新爱情美文