前言:这次学习实际操作跟hdfs交互,
hadoop fs
命令代表着hadoop的file system文件系统。要操作hdfs就需要跟这个前缀命令打交道。
一、往hdfs上传文件
实验目的:观察如何往hdfs上传文件,并通过网页界面查看超过128m的文件分块和存储情况。
实验命令:hadoop fs -put 文件路径
实际操作如下图:
二、hdfs的增删改查
hadoop fs -mkdir 文件目录 //增
hadoop fs -rm 文件名 //删
hadoop fs -text 文件名 //改
hadoop fs -ls 文件路径 //查
三、修改hdfs的配置文件
在<configuration>标签组里添加<property>配置
- 下面这个标签属性是配置文件默认的备份分数,比如设置为2这样文件在hdfs中就备份2份。
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
- 下面这个标签属性是设置hadoop每隔多长时间检查集群机器中的哪些机器宕机了,默认为300000毫秒(即5分钟),我们可以设置短一些(比如10000毫秒,即1分钟)。注意:集群机器宕机了一两台是不会影响集群对外提供服务的,因为集群本就是多台机器为同一个任务服务。
<property>
<name>dfs.namenode.heartbeat.recheck-interval</name>
<value>10000</value>
</property>
- 下面这个标签属性是用来配置hdfs取消用户权限检查的
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
还有许多属性没记录到,需要的时候百度或者查api就足够了。
最后放一个HDFS的理论篇,别人以漫画的形式写的。
https://mp.weixin.qq.com/s/8p6R8j2LLmFcaenOtVywVg
网友评论