HDFS

作者: Manfestain | 来源:发表于2020-04-03 14:33 被阅读0次

HDFS（Hadoop Distributed File System），是一个文件系统，用于存储文件，通过目录树来定位文件，其实，它是分布式的，联合多台服务器实现功能。HDFS容错性高，适合处理大数据。
使用场景：

缺点：

HDFS组成架构

HDFS文件块大小

HDFS的文件在物理上是分块（block）存储的，块的大小可以通过配置参数（dfs.blocksize）来规定，在Hadoop2.x版本中默认是128M，老版本是64M。
块的大小与磁盘的传输速率有关系：

-put命令与-copyFromLocal功能相同

-get命令与-copyToLocal功能相同

hadoop fs -appendToFile ./append.txt /user/input/demo.txt：将本地的append.txt中的内容追加到已经存在的文件demo.txt的末尾
hadoop fs -getmerge /user/input/* ./zaiyiqi.txt：将HDFS上/user/input/目录下的所有文件合并下载到本地，并将结果保存在zaiyiqi.txt中。
hadoop fs -du -h /user/：统计文件夹的大小

hadoop fs -du -h -s /：根目录下所有文件夹大小的总和

当副本数大于数据节点的个数时，数据的实际副本数仍然为节点数，只有当新增节点时，才会生成新的副本，直到增加的节点数与数据的副本数相同时停止。

本文标题：HDFS

本文链接：https://www.haomeiwen.com/subject/nnjxphtx.html