好程序员大数据培训教学点睛：Hadoop基础篇

作者: ab6973df9221 | 来源:发表于2019-05-22 10:35 被阅读0次

好程序员大数据培训教学点睛：Hadoop基础篇
好程序员高端大数据培训班点睛：关于HDFS的二三事
好程序员大数据培训分享hadoop的知识总结
好程序员大数据培训分享Hadoop阶段的高可用配置
好程序员大数据培训教程分享HDFS总结
好程序员大数据培训分享Hadoop学习干货
好程序员大数据培训教程分享hdfs学习干货
好程序员大数据培训解析 Hadoop和spark的性能比较
好程序员大数据培训分享函数+map映射+元祖
好程序员大数据培训纪实：HBase知识点集中总结

　　好程序员大数据培训教学点睛：Hadoop基础篇，Hadoop包含两个部分：

　　1.Hadoop Distributed File System (Hadoop分布式文件系统)

　　HDFS具有高容错性，并且可以被部署在低价的硬件设备之上。HDFS很适合那些有大数据集的应用，并且提供了对数据读写的高吞吐率。HDFS是一个master/slave的结构，就通常的部署来说，在master上只运行一个Namenode，而在每一个slave上运行一个Datanode。

　　HDFS支持传统的层次文件组织结构，同现有的一些文件系统在操作上很类似，比如你可以创建和删除一个文件，把一个文件从一个目录移到另一个目录，重命名等等操作。Namenode管理着整个分布式文件系统，对文件系统的操作(如建立、删除文件和文件夹)都是通过Namenode来控制。

　　2、MapReduce的实现

　　MapReduce是Google 的一项重要技术，它是一个编程模型，用以进行大数据量的计算。对于大数据量的计算，通常采用的处理手法就是并行计算。至少现阶段而言，对许多开发人员来说，并行计算还是一个比较遥远的东西。MapReduce就是一种简化并行计算的编程模型，它让那些没有多少并行计算经验的开发人员也可以开发并行应用。

　　MapReduce的名字源于这个模型中的两项核心操作：Map和 Reduce。简单的说来，Map是把一组数据一对一的映射为另外的一组数据，其映射的规则由一个函数来指定，比如对[1, 2, 3, 4]进行乘2的映射就变成了[2, 4, 6, 8]。Reduce是对一组数据进行归约，这个归约的规则由一个函数指定，比如对[1, 2, 3, 4]进行求和的归约得到结果是10，而对它进行求积的归约结果是24。

网友评论

好程序员大数据

本文标题：好程序员大数据培训教学点睛：Hadoop基础篇

本文链接：https://www.haomeiwen.com/subject/mjkyzqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

好程序员大数据培训教学点睛：Hadoop基础篇

相关文章