作为公司的平台部门,需要给各个业务线提供平台的服务,那么如何建设一个满足各种需求的公司平台级OLAP分析服务呢。首...[作者空间]
华为宣布开源了CarbonData项目,该项目于6月3日通过Apache社区投票,成功进入Apache孵化器。Ca...[作者空间]
本篇文章主要讲解phoenix与spark做整合,目的是将phoenix做存储,spark做计算层。这样就结合了p...[作者空间]
本文根据2016年7月北京IBM Spark沙龙上的分享讲稿整理而成。 大家好,我是来自GrowingIO的数据工...[作者空间]
checkpoint 相当于 cache的备胎;checkpoint的数据一般都会放在容错的文件系统当中,比如h...[作者空间]
1.优化数据结构 2.修改并行度 3.对数据做采样,对数据倾斜的key增加随机的前缀. 4.局部聚合+全局聚合 5...[作者空间]
Ui相关流程Spark集群启动之后,我们可以通过Web观查集群状态等信息,这一部分工作是Spark WebUi 模...[作者空间]
作者:Anil Madan** 译者:张玉宏 文源:LinkeDin 转自:CSDN**Pa...[作者空间]
1、为什么引入Backpressure 默认情况下,Spark Streaming通过Receiver以生产者生产...[作者空间]
Yarn的使用: 运行在yarn上和其他计算框架共享资源,会有不稳定情况, hadoop 2.6推出lable-b...[作者空间]
zookeeper.session.timeout.ms:该值超时的话, spark的当前kafkaReceive...[作者空间]
前言 最近在专注Spark开发,记录下自己的工作和学习路程,希望能跟大家互相交流成长具体代码可参考本人GitHub...[作者空间]
前言 最近在专注Spark开发,记录下自己的工作和学习路程,希望能跟大家互相交流成长本文章更倾向于实战案例,涉及框...[作者空间]
前言 最近在专注Spark开发,记录下自己的工作和学习路程,希望能跟大家互相交流成长QQ:86608625 微信...[作者空间]
解决方案[作者空间]
Spark自带的JdbcRDD,只支持Long类型的分区参数,分区必须是一个Long区间。很多情况下,这种方式都不...[作者空间]