美文网首页Hadoop
HDFS常用命令操作-hdfs数据导出到本地

HDFS常用命令操作-hdfs数据导出到本地

作者: 彩色的炮灰 | 来源:发表于2023-10-25 15:59 被阅读0次

1、创建目录
创建单层目录
执行命令:hdfs dfs -mkdir /ied


image.png

利用Hadoop WebUI查看创建的目录


image.png

创建多层目录,执行命令:hdfs dfs -mkdir /luzhou/lzy,会报错,因为/luzhou目录不存在


image.png

可以先创建/luzhou目录,然后在里面再创建lzy子目录,但是也可以一步到位,需要一个-p参数
执行命令:hdfs dfs -mkdir -p /luzhou/lzy


image.png

利用Hadoop WebUI查看创建的多层目录


image.png

2、查看目录
执行命令:hdfs dfs -ls /,查看根目录


image.png image.png

执行命令:hdfs dfs -ls /luzhou


image.png

查看根目录里全部的资源,要用到地柜参数-R(必须大写),执行命令:hdfs dfs -ls -R /


image.png

3、上传本地文件到HDFS
创建test.txt文件,执行命令:echo "hello hadoop world" > test.txt


image.png

查看test.txt文件内容


image.png

上传test.txt文件到HDFS的/ied目录,执行命令:hdfs dfs -put test.txt /ied


image.png

查看是否上传成功


image.png

利用Hadoop WebUI界面查看


image.png

4、查看文件内容
执行命令:hdfs dfs -cat /ied/test.txt


image.png

5、下载HDFS文件到本地
先删除本地的test.txt文件


image.png

下载HDFS文件系统的/ied/test.txt到本地当前目录不改名,执行命令:hdfs dfs -get /ied/test.txt,检测是否下载成功


image.png

可以将HDFS上的文件下载到本地指定位置,并且可以更改文件名

执行命令:hdfs dfs -get /ied/test.txt /home/exam.txt


image.png

检查是否下载成功


image.png

6、删除HDFS文件
执行命令:hdfs dfs -rm /ied/test.txt


image.png

检查是否删除成功


image.png

使用通配符,可以删除满足一定特征的文件


image.png

7、删除HDFS目录
执行命令:hdfs dfs -rmdir /luzhou


image.png

提示-rmdir命令删除不了非空目录,要递归删除才能删除非空目录:hdfs dfs -rm -r /luzhou


image.png

删除空目录/BigData,执行命令:hdfs dfs -rmdir /BigData


image.png

8、移动目录或文件
-mv命令兼有移动与改名的双重功能


image.png

将/ied目录更名为/ied01,执行命令:hdfs dfs -mv /ied /ied01

利用Hadoop WebUI查看是否更名成功


image.png

将/ied01/exam.txt更名为/ied/test.txt,执行命令:hdfs dfs -mv /ied01/exam.txt /ied01/test.txt


image.png

查看改名后的test.txt文件内容


image.png

9、文件合并下载
现在/ied01里有一个test.txt,创建sport.txt和music.txt并上传


image.png

合并/ied01目录的文件下载到本地当前目录的merger.txt,执行命令:hdfs dfs -getmerge /ied01/* merger.txt


image.png

查看本地的merger.txt,看是不是三个文件合并后的内容


image.png

merger.txt是music.txt、sport.txt与test.txt合并后的结果

10、检查文件信息
检查test.txt文件,执行命令:hdfs fsck /ied01/test.txt -files -blocks -locations -racks


image.png

————————————————
参考链接:https://blog.csdn.net/weixin_64272885/article/details/127993386

相关文章

  • HDFS 配置本地客户端

    之前,一直通过Linux命令操作HDFS。接下来,在本地配置HDFS客户端,通过编写代码操作HDFS。 环境: m...

  • Kafka connect HDFS

    HDFS connector允许以各种格式将Kafka topic中的数据导出到HDFS文件中,并与Hive...

  • hadoop离线数据分析03

    HDFS基本操作 元数据元数据.png MapReduce模拟思路.png HIVE的基本操作 开启本地模式bin...

  • NEXT学院-剑指大数据面试 百度网盘分享

    01、大数据面试导学02、课程目录03、hdfs架构详解04、图解hdfs核心组件的职责05、图解hdfs写数据流...

  • hive 导出数据

    1. 导出到hdfs insert overwrite directory '$hdfs_dir' select ...

  • hadoop基础知识

    hdfs的块大小默认为129m map操作的输出写入本地磁盘,而不是hdfs文件,reduce的输出是在hdfs文...

  • hadoop hdp 阿里云 There are 3 dat

    阿里云上面安装hdp服务 hdfs服务,本地 spark stream 消费kafka数据,在hdfs上面设置保存...

  • HDFS中API的使用

    在项目开发中,有时我们需要通过HDFS的api来对文件进行操作,比如将数据上传到HDFS或者从HDFS获取数据等。...

  • Sqoop数据导入/导出

    1. 从HDFS导出到RDBMS数据库 1.1 准备工作 写一个文件 上传到hdfs:hadoop fs -put...

  • HDFS常用命令

    1、hadoop常用命令 2、HDFS细节 HDFS:Hadoop Distributed File System...

网友评论

    本文标题:HDFS常用命令操作-hdfs数据导出到本地

    本文链接:https://www.haomeiwen.com/subject/xsbeidtx.html