美文网首页
HDFS详解-01

HDFS详解-01

作者: 苏木logwood | 来源:发表于2017-12-19 15:50 被阅读26次

HDFS详解-01

作业:
1.2台机器配置ssh互相信任关系
2.A目录的文件夹c,先移动到B目录;再B目录ln -s /B/c /A/c;再检查权限和用户和用户组

HDFS详解:

1.三个进程
NameNode(NN):名称节点       -->client第一个操作的对象
DataNode(DN):数据节点       --> 存储数据的 
Secondary NameNode(SNN):第二名称节点
2.block(数据块)
大小:
    64M、默认128M
参数:hdfs-default.xml里面的dfs.blocksize
3.副本数:
hdfs-default.xml:
    dfs.replication:3
    一个块会变为3个块
hadoop2.x:一般公司就3个
hadoop3.0:1.5(新特性 纠删码)1 + 0.5
4.案例
一个文件130M:128M 2M 两个块
    实际存储:130M
    多少个块:6个

举例:1桶水130ML,两个瓶子(128ML规格),第一个装满了128,第二个瓶子只装2ML,实际存储了多少的水?
悬念(面试题):
    多出2M会占一个数据块,会有问题?
    会维护在NN的内存,可能会oom(撑爆)
    
    比如文件都是小文件,3M、5M?
        合并小文件/设计的时候,尽量让一个文件的块是120M-128M
5.架构设计
NameNode:
    文件系统的命名空间   (面试题)
    1.文件名称
    2.文件目录结构
    3.文件的属性(权限 创建时间 副本数)
    
    4.文件对应哪些数据块 --> 这些数据块对应哪些DataNode节点上
        不会持久化存储这个映射关系,是通过集群的启动和运行时,DataNode定期发送blockReport给NN,以此NN在【内存】中动态维护这种映射关系。

    存储:维护文件系统树及整个树内的所有文件和目录,这些信息以两种文件形式永久保存在本地磁盘。
        命名空间镜像文件fsimage + 编辑日志editlog
DataNode:
存储:数据块 + 数据块校验和
    与NN通信:
        1.每隔3秒发送一次心跳 参数可配置
        2.每隔10次心跳发送一次blockReport (30秒)
Secondary NameNode:
存储:命名空间镜像文件fsimage + 编辑日志editlog
作用:定期合并fsimage + editlog文件为新的fsimage,推送给NN,称为检查点(checkpoint)
参数:hdfs-default.xml文件下的
        dfs.namenode.checkpoint.period: 3600 秒
实验:NN挂了,SNN去恢复(企业不用)
    http://hmilyzhangl.iteye.com/blog/1407214
企业:
HDFS HA
YARN HA
作业:
    1.rundeck部署及demo
    2.Yarn部署
    3.Mapreduce Job和查看日志

【来自@若泽大数据】

相关文章

  • HDFS详解-01

    HDFS详解-01 作业: HDFS详解: 1.三个进程 2.block(数据块) 3.副本数: 4.案例 5.架...

  • NEXT学院-剑指大数据面试 百度网盘分享

    01、大数据面试导学02、课程目录03、hdfs架构详解04、图解hdfs核心组件的职责05、图解hdfs写数据流...

  • 大数据面试 | 01 HDFS面试热点--HDFS 架构及读写

    文章目录 HDFS 简介以及架构设计 详解SecondaryNameNode HDFS小文件危害以及解决方案 HD...

  • HDFS详解

    1、HDFS进程 NameNode:名称节点DataNode:数据节点 SecondaryNameNode:第二名...

  • HDFS详解

    一.HDFS简介 hdfs是一个文件系统,用于存储文件,通过统一的命名空间——目录树来定位文件,并且是分布式的,由...

  • hdfs详解

    hdfs简介 hdfs是hadoop中分布式的文件存储系统;具有高容错、可扩展;广泛的用于大数据项目中(不仅仅是h...

  • HDFS详解

    HDFS:是hadoop的核心子项目,是一个分布式的文件系统它整合了众多的文件系统,并提供了一个类FileSyst...

  • HDFS详解

    Hadoop2.X后可以划分为三部分:HDFS、MapReduce和Yarn,本篇主要看一下HDFS。 架构图 进...

  • HDFS详解

    认识HDFS HDFS的特点: 高容错性高吞吐量故障的检测和自动快速恢复流式的数据访问大数据集一次写入,多次读写 ...

  • HDFS详解

    可以在http://master:50070上访问hdfs的web页面。本文章主题如下: HFDS结构 NameN...

网友评论

      本文标题:HDFS详解-01

      本文链接:https://www.haomeiwen.com/subject/tzxiwxtx.html