美文网首页
Hdfs基础与应用

Hdfs基础与应用

作者: 曹振华 | 来源:发表于2016-12-21 16:47 被阅读28次

    一: HDFS是什么?

     源自于Google的GFS论文
     发布与2003年10月
     HDFS是GFS克隆版
        特点:
            1: 易于扩展的分布式文件系统
            2:    运行在大量普通廉价机器上,提供容错机制
            3:    为大量用户提供性能不错的文件存取服务
    

    二: HDFS优点

     1.高容错性
            数据自动保存多个副本
            副本丢后,自动恢复
     2. 适合批处理
            移动技术而非数据
            数据位置暴露给计算框架
     3. 适合大数据处理
            GB,TB甚至PB级别数据
            百万规模以上的文件数量
            10k+节点规模
    4.    流式文件访问
            一次性写入,多次读取
            保证数据一致性
     5. 可构建在廉价机器上
            通过多副本提高可靠性
            提高了容错和恢复机制 
    

    三: HDFS缺点

     1. 低延迟数据访问
            比如毫秒级别
            低延迟与高吞吐率
      2. 小文件存取
            占用NameNode大量内存
            寻道时间超过读取时间
      3.并发写入,文件随机修改
            一个文件只能有一个写入
            仅支持append
    

    相关文章

      网友评论

          本文标题:Hdfs基础与应用

          本文链接:https://www.haomeiwen.com/subject/fvvqvttx.html