美文网首页
Hadoop学习笔记(2)-HDFS

Hadoop学习笔记(2)-HDFS

作者: 丸蛋蟹 | 来源:发表于2017-03-10 16:16 被阅读20次

自行整理, 学习用途, 侵知删歉

NameNode内存分配

当一个NameNode运行的时候, 所有的metaData都储存在RAM中(快速响应);

item(150 - 200 bytes):
-文件名, 权限等
-每一个block的信息

为什么HDFS适合少却大的文件: 分出来的block比较少, 利于查找读取

HDFS 文件权限

HDFS中的文件有所有者, 组, 权限. [和linux类似]
文件权限

执行
r w x

对于路径, x意味着他的children可以访问
HDFS believes you are who you tell it you are
HDFS的安全性包括授权(authorization), 但是却比较基础, 如果要加强, 可以集成Kerberos

NameNode Web UI

HDFS file shell

HDFS不是一个通用文件系统, 所以需要特殊的软件访问.
客户端用户一般可以用hadoop fs command指令访问HDFS.

  • 显示/user/fred/sales.txt的文件内容
$ hadoop fs -cat /usr/fred/sales.txt
  • 新建一个report路径
$ hadoop fs -mkdir /reports
$ hadoop fs -put sale.txt /reports
$ hadoop fs -get /reports/sales.txt
  • 获得一个HDFS路径下列表
$ hadoop fs -ls /
  • 删除文件
$ hadoop fs -rm /reports/sales.txt

总结

  • HDFS通过在机器间分布大文件块来支持MapReduce的数据本地化
  • HDFS通过数据备份来实现容错机制
  • NameNode守护进程在内存中拥有所有HDFS metadata, 同时也保存在硬盘上

相关文章

  • hadoop学习02

    hadoop学习笔记 - HDFS - 完全分布式模式 Hadoop完全分布式模式结构 hadoop01hadoo...

  • Hadoop学习笔记(2)-HDFS

    自行整理, 学习用途, 侵知删歉 NameNode内存分配 当一个NameNode运行的时候, 所有的metaDa...

  • hadoop2.*学习笔记三(YARN+ MapReduce+E

    关于hadoop hdfs配置请参考hadoop学习笔记二 内容概括:在笔记二所在的环境上配置 YARN 和 M...

  • Hadoop2-HDFS-read file

    Hadoop读书笔记2-HDFS-read write file HDFS是一个分布式文件系统,在HDFS上写文...

  • Hadoop相关文章索引(2)——Hadoop运维主题

    hadoop运维笔记1 Hadoop集群日常运维 Hadoop运维经验杂谈 Hadoop运维笔记 之 调整hdfs...

  • HDFS HA 原理

    HDFS HA 原理 标签:HDFS HA 概述 在 Hadoop 2.x 版本中,Hadoop 实现了 HDFS...

  • HDFS常用命令

    1、hadoop常用命令 2、HDFS细节 HDFS:Hadoop Distributed File System...

  • Hadoop安装指南

    hadoop单机/伪分布式安装指导链接: hadoop集群安装 HDFS学习资源: HDFS入门 Hbase学习资...

  • Hadoop学习笔记—HDFS

    [TOC] 上一份工作主要负责大数据平台的建设,在这个过程中积累了一些Hadoop生态组件的搭建和使用笔记,由于时...

  • hadoop学习笔记(一)

    一、HDFS简介 1.1Hadoop2介绍 hadoop1是由HDFS和MapReduce组成,hadoop2由H...

网友评论

      本文标题:Hadoop学习笔记(2)-HDFS

      本文链接:https://www.haomeiwen.com/subject/moabgttx.html