[toc] 背景知识: Spark与Hadoop差异 Spark是在借鉴了MapReduce之上发展而来的,继承了...[作者空间]
导语:工作中常常和Spark on YARN, Hadoop on YARN打交道,经常在各种日志中摸爬滚打,为提...[作者空间]
【原创】Helenykwang 于2018-01-13 18:10:18编写 不用maven,不用sbt,只需三个...[作者空间]
转载自 http://www.wangsenfeng.com/articles/2016/10/26/147746...[作者空间]
引子 为什么需要 NameNode HA 和 Federation ? 1. 规避NameNode单点故障,sec...[作者空间]
引子 为什么需要HDFS? 因为一个物理计算机的存储已经hold不住我们庞大的数据集。 HDFS的特点是什么? H...[作者空间]
引子 为什么需要MapReduce? 因为MapReduce可以“分而治之”,将计算大数据的复杂任务分解成若干简单...[作者空间]
hadoop是一个分布式系统基础架构,主要功能有存储+计算,分别由hdfs和map-reduce模块实现。 had...[作者空间]