HDFS实践

作者: 大数据阶梯之路 | 来源:发表于2019-07-22 00:22 被阅读4次

    前言:这次学习实际操作跟hdfs交互,hadoop fs命令代表着hadoop的file system文件系统。要操作hdfs就需要跟这个前缀命令打交道。

    一、往hdfs上传文件

    实验目的:观察如何往hdfs上传文件,并通过网页界面查看超过128m的文件分块和存储情况。
    实验命令:hadoop fs -put 文件路径
    实际操作如下图:

    图片.png

    二、hdfs的增删改查

    hadoop fs -mkdir 文件目录   //增
    hadoop fs -rm 文件名   //删
    hadoop fs -text 文件名   //改
    hadoop fs -ls 文件路径   //查
    

    三、修改hdfs的配置文件

    在<configuration>标签组里添加<property>配置

    • 下面这个标签属性是配置文件默认的备份分数,比如设置为2这样文件在hdfs中就备份2份。
    <property>
      <name>dfs.replication</name>
      <value>2</value>
    </property>
    
    • 下面这个标签属性是设置hadoop每隔多长时间检查集群机器中的哪些机器宕机了,默认为300000毫秒(即5分钟),我们可以设置短一些(比如10000毫秒,即1分钟)。注意:集群机器宕机了一两台是不会影响集群对外提供服务的,因为集群本就是多台机器为同一个任务服务。
    <property>
      <name>dfs.namenode.heartbeat.recheck-interval</name>
      <value>10000</value>
    </property>
    
    • 下面这个标签属性是用来配置hdfs取消用户权限检查的
    <property>
            <name>dfs.permissions</name>
            <value>false</value>
    </property>
    

    还有许多属性没记录到,需要的时候百度或者查api就足够了。

    最后放一个HDFS的理论篇,别人以漫画的形式写的。
    https://mp.weixin.qq.com/s/8p6R8j2LLmFcaenOtVywVg

    相关文章

      网友评论

        本文标题:HDFS实践

        本文链接:https://www.haomeiwen.com/subject/ikwbhctx.html