初始Hadoop

作者: 怀夕 | 来源:发表于2018-05-15 21:07 被阅读0次

    一、大数据的定义

            大数据=5V+1C

            5V:variety(多样化),volume(海量),velocity(快速),vitality(灵活),value(价值)

            1C:complexity(复杂性)


    二、hadoop的定义

           广义:以hadoop为主的生态圈,包括hadoop,flume......

           狭义:hadoop=Apache hadoop——网址:hadoop.apache.org


    三、hadoop的三大组件

           三大组件:存储、计算、资源和作业调度

           hadoop的三个版本:hadoop1.x,hadoop2.x,hadoop3.x

           hadoop1.x:HDFS(存储)+MapReduce(计算、资源和作业调度)

           hadoop2.x:HDFS(存储)+MapReduce(计算)+YARN(资源和作业调度平台)

    注:目前企业多用hadoop2.x,HDFS和MapReduce都是跑在YARN平台上。


    相关文章

      网友评论

        本文标题:初始Hadoop

        本文链接:https://www.haomeiwen.com/subject/hrmydftx.html