前言 只有光头才能变强。 文本已收录至我的GitHub精选文章,欢迎Star:https://github.com...[作者空间]
0x00 概述 半年前推荐过一波数据仓库相关的书单,现在应读者朋友们的要求,更新一波推荐的书单! 和以前一样,居士...[作者空间]
同学们在学习Spark Steaming的过程中,可能缺乏一个练手的项目,这次通过一个有实际背景的小项目,把学过的...[作者空间]
大数据技术,最早于1980年被首次提及,却在近几年才获得突飞猛进的发展。相较于几十年前神经网络算法捉襟见肘的计算能...[作者空间]
Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提...[作者空间]
1.ZooKeeper的产生 ZooKeeper是一种分布式协调服务。在分布式环境中协调和管理服务是一个复杂的过程...[作者空间]
很多人都知道大数据很火,就业很好,薪资很高,想往大数据方向发展。但该学哪些技术,学习路线是什么样的呢?用不用参加大...[作者空间]
目前,大数据领域每年都会涌现出大量新的技术,成为大数据获取、存储、处理分析或可视化的有效手段。大数据技术能够将大规...[作者空间]
RDD(Resilient Distributed Dataset):弹性分布式数据集。 特性 A list of...[作者空间]
macOS Sierra 10.12.4 Spark 1.6.2 Python 2.7 转载请注明出处:http:...[作者空间]
实时计算 上篇文章大致介绍了离线计算MapReduce和Spark,但是无法满足对实时性要求较高的业务,下面我们来...[作者空间]
云栖社区围绕大数据技术——Spark整理了一份详尽的学习、实践课程,整个课程分为三大部分: 一、基础打磨:《Sca...[作者空间]
1. HBase存储中的3个核心机制 1.flush机制:当MemStore达到阈值之后,会flush成一个Sto...[作者空间]
1. HBase介绍,Hbase是什么? HBase -- Hadoop Database ,是一个高可靠、高性能...[作者空间]
在前面的文章《spark基础(上篇)》和《spark基础(下篇)》里面已经介绍了spark的一些基础知识,知道了s...[作者空间]