一篇漫画理解HDFS读写工作原理

作者: 俺是亮哥 | 来源:发表于2017-05-15 15:07 被阅读459次

一篇漫画理解HDFS读写工作原理
一篇漫画理解HDFS读写工作原理
HDFS工作原理漫画
漫画HDFS工作原理
Hdfs读写原理
图文详解HDFS工作机制
成都大数据开发技术知识点，加米谷大数据培训
hadoop HDFS原理解析
Hadoop学习笔记（三）漫画解读HDFS读写原理
经典漫画讲解HDFS存储机制与运行原理

浅显易懂的介绍，很多资料对File Blocks副本Location位置的描述是有误的，正确的理解请参考本漫画，后附Hadoop 2.7.3 BlockPlacementPolicyDefault类来佐证

**漫画转载自 - 卓寿杰 Soul Joy - 博客频道 - CSDN.NET http://blog.csdn.net/u011239443/article/details/51751462
**

Hadoop 2.7.3 BlockPlacementPolicyDefault.java
默认的3副本存放规则：

如果写入Client是HDFS集群中的DN，则1st副本存放在本Client所在主机；
如果写入Client不是HDFS集群中DN，则1st副本随机存放在集群中某个DN(不太满或者不太忙的DN);
2nd副本存放于和1st副本不同机架的某DN节点上；
3rd副本存放于和2nd副本相同机架的另外一个DN上。

/**
 * The class is responsible for choosing the desired number of targets
 * for placing block replicas.
 * The replica placement strategy is that if the writer is on a datanode,
 * the 1st replica is placed on the local machine, 
 * otherwise a random datanode. The 2nd replica is placed on a datanode
 * that is on a different rack. The 3rd replica is placed on a datanode
 * which is on a different node of the rack as the second replica.
 */
@InterfaceAudience.Private
public class BlockPlacementPolicyDefault extends BlockPlacementPolicy {

  private static final String enableDebugLogging =
    "For more information, please enable DEBUG log level on "
    + BlockPlacementPolicy.class.getName();

  private static final ThreadLocal<StringBuilder> debugLoggingBuilder
      = new ThreadLocal<StringBuilder>() {
        @Override
        protected StringBuilder initialValue() {
          return new StringBuilder();
        }
      };

关于block副本数需要注意的地方：