美文网首页
HDFS--机架感知

HDFS--机架感知

作者: 大炮对着虫子 | 来源:发表于2018-10-31 11:34 被阅读17次

君子生非异也,善假于物也。

Hadoop的设计目的:解决海量大文件的处理问题,主要指大数据的存储和计算问题,其中,HDFS解决数据的存储问题;MapReduce解决数据的计算问题

Hadoop的设计考虑:设计分布式的存储和计算解决方案架构在廉价的集群之上,所以,服务器节点出现宕机的情况是常态。数据的安全是重要考虑点。HDFS的核心设计思路就是对用户存进HDFS里的所有数据都做冗余备份,以此保证数据的安全

那么Hadoop在设计时考虑到数据的安全,数据文件默认在HDFS上存放三份。显然,这三份副本肯定不能存储在同一个服务器节点。那怎么样的存储策略能保证数据既安全也能保证数据的存取高效呢?

HDFS分布式文件系统的内部有一个副本存放策略:以默认的副本数=3为例:

1、第一个副本块存本机

2、第二个副本块存跟本机同机架内的其他服务器节点

3、第三个副本块存不同机架的一个服务器节点上

好处:

1、如果本机数据损坏或者丢失,那么客户端可以从同机架的相邻节点获取数据,速度肯定要比跨机架获取数据要快。

2、如果本机所在的机架出现问题,那么之前在存储的时候没有把所有副本都放在一个机架内,这就能保证数据的安全性,此种情况出现,就能保证客户端也能取到数据

HDFS为了降低整体的网络带宽消耗和数据读取延时,HDFS集群一定会让客户端尽量去读取近的副本,那么按照以上头解释的副本存放策略的结果:

1、如果在本机有数据,那么直接读取

2、如果在跟本机同机架的服务器节点中有该数据块,则直接读取

3、如果该HDFS集群跨多个数据中心,那么客户端也一定会优先读取本数据中心的数据

但是HDFS是如何确定两个节点是否是统一节点,如何确定的不同服务器跟客户端的远近呢?答案就是机架感知。!!!!

在默认情况下,HDFS集群是没有机架感知的,也就是说所有服务器节点在同一个默认机架中。那也就意味着客户端在上传数据的时候,HDFS集群是随机挑选服务器节点来存储数据块的三个副本的。
那么假如,datanode1和datanode3在同一个机架rack1,而datanode2在第二个机架rack2,那么客户端上传一个数据块block_001,HDFS将第一个副本存放在dfatanode1,第二个副本存放在datanode2,那么数据的传输已经跨机架一次(从rack1到rack2),然后HDFS把第三个副本存datanode3,此时数据的传输再跨机架一次(从rack2到rack1)。显然,当HDFS需要处理的数据量比较大的时候,那么没有配置机架感知就会造成整个集群的网络带宽的消耗非常严重。

相关文章

  • HDFS--机架感知

    君子生非异也,善假于物也。 Hadoop的设计目的:解决海量大文件的处理问题,主要指大数据的存储和计算问题,其中,...

  • 机架感知

    HDFS NameNode对文件块复制相关所有事物负责,它周期性接受来自于DataNode的HeartBeat和B...

  • HDFS 机架感知(Rack Awareness)

    什么是机架感知 设置机架感知的意义: 默认情况: 默认情况下HDFS没有开启机架感知,所有的机器默认都是在同一个机...

  • 运维培训总结

    运维培训 in 西安 1.机架感知: 要将hadoop机架感知的功能启用,配置非常简单,在namenode所在机器...

  • Hadoop机架感知

    Hadoop机架感知 (手机码字不容易...) 1.背景 Hadoop在设计时考虑到数据的安全与高效,数...

  • Hadoop8 机架感知配置和原理

    Hadoop 机架感知配置和原理 Hadoop机架感知 1.背景 Hadoop在设计时考虑到数据的安全与高效,数据...

  • hadoop机架感知以及HDFS

    HDFS副本存放策略: 第一个副本,在客户端相同的节点(如果客户端是集群外的一台机器,就随机选节点,但是系统会避免...

  • (转)关于机架感知(RackAwareness)

    一、背景分布式的集群通常包含非常多的机器,由于受到机架槽位和交换机网口的限制,通常大型的分布式集群都会跨好几个机架...

  • Kafka之分区副本分配

    分区和角色 分区分配需要从三个角度考量: 分配逻辑 没有开启机架感知(比如没有配置机架或者指定了disable-r...

  • Hadoop 2.6.0 HDFS Rack Awareness

    Hadoop 2.6.0 HDFS Rack Awareness(机架感知)原理与配置步骤详解 前言:  多副本前...

网友评论

      本文标题:HDFS--机架感知

      本文链接:https://www.haomeiwen.com/subject/vmaotqtx.html