美文网首页
Hadoop项目基本

Hadoop项目基本

作者: lg大大 | 来源:发表于2017-07-25 09:37 被阅读0次

    Common : 一系列 组件和接口,用于分布式文件系统和通用I/O(序列化,java RPC和持久化数据结构)
    Avro : 一种序列化系统,用于支持高效,快语言的RPC和持久化数据存储
    MapReduce : 分布式数据处理模型和执行华景,运行于大型商用机集群
    HDFS : 分布式文件系统,云星宇大型商用机集群
    Pig:数据流语言和运行环境,用于探究非常庞大的数据集.Pig运行在MapReduce和HDFS集群上
    Hive: 一种分布式的,按列存储的数据仓库.Hive管理HDFS中存储的数据,并提供基于SQL的查询语言用于查询数据
    HBase:一种分布式.按列存储的数据库.HBase使用HDFS作为底层存储,同事支持MapReduce的批量式计算和点查询
    zookeeper : 一种分布式,可用性高的协调服务.zookeeper提供分布式锁之类的基本服务用于构建分布式应用
    Sqoop : 该工具用于结构化数据存储和HDFS之间高效批量传输数据
    Oozie : 该服务用于运行和调度Hadoop作业

    相关文章

      网友评论

          本文标题:Hadoop项目基本

          本文链接:https://www.haomeiwen.com/subject/vgxwkxtx.html