一、大数据的定义
大数据=5V+1C
5V:variety(多样化),volume(海量),velocity(快速),vitality(灵活),value(价值)
1C:complexity(复杂性)
二、hadoop的定义
广义:以hadoop为主的生态圈,包括hadoop,flume......
狭义:hadoop=Apache hadoop——网址:hadoop.apache.org
三、hadoop的三大组件
三大组件:存储、计算、资源和作业调度
hadoop的三个版本:hadoop1.x,hadoop2.x,hadoop3.x
hadoop1.x:HDFS(存储)+MapReduce(计算、资源和作业调度)
hadoop2.x:HDFS(存储)+MapReduce(计算)+YARN(资源和作业调度平台)
注:目前企业多用hadoop2.x,HDFS和MapReduce都是跑在YARN平台上。
网友评论