美文网首页大数据程序员技术干货
史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

作者: 紫霞等了至尊宝五百年 | 来源:发表于2018-06-15 09:05 被阅读64次








HDFS 环境搭建



HDFS 伪分布式环境搭建
CentOS 环境安装步骤
MacOS安装环境
安装jdk
jdk安装路径
/usr/libexec/java_home -V:列出所有版本的JAVA_HOME
设置 JAVA_HOME
  • 添加java_home到.bash_profile文件中
export JAVA_HOME=$(/usr/libexec/java_home)
export PATH=$JAVA_HOME/bin:$PATH
export CLASS_PATH=$JAVA_HOME/lib 
Mac OS X ssh设置

输入命令ssh localhost,可能遇到如下问题



原因是没打开远程登录,进入系统设置->共享->远程登录打开就好



这时你再ssh localhost一下
  • 下载 Hadoop


  • 解压到soft目录



    官方指南
  • 编辑 hadoop-env.sh 文件






    Hadoop也可以在伪分布模式下的单节点上运行,其中每个Hadoop守护进程都在单独的Java进程中运行



    具体更改
    新建一个临时文件目录
    编辑 hdfs/core-site.xml 文件


    配置 datanode 节点数

    启动 hdfs






查看进程

访问http://localhost:50070/

表示HDFS已经安装成功
存活节点
步骤小结

关闭

HDFS Shell 操作


官网指南



先启动 HDFS

配置 hadoop 环境变量
成功
指令集
dfs fs 无差异
上传一个 txt 文件

创建文件夹



多层次文件夹



遍历所有文件夹




删除文件/文件夹




所上传的文件

Java 操作 HDFS 开发环境搭建






pom 文件

JavaAPI 操作 HDFS文件系统


测试通过
  • 测试创建文件方法



  • 查看 HDFS 文件的内容



  • 上传文件到 HDFS


  • 上传文件到 HDFS(带进度条)



    测试通过
  • 下载文件到本地



    测试通过
  • 查看某个目录下的所有文件



    测试通过
  • 删除文件/文件夹




相关文章

网友评论

本文标题:史上最快! 10小时大数据入门实战(三)-分布式文件系统HDFS

本文链接:https://www.haomeiwen.com/subject/utfpeftx.html