美文网首页玩转大数据大数据,机器学习,人工智能大数据
扣丁学堂大数据开发JavaAPI操作HDFS之文件上传实现

扣丁学堂大数据开发JavaAPI操作HDFS之文件上传实现

作者: 994d14631d16 | 来源:发表于2018-09-20 10:19 被阅读4次

  今天扣丁学堂大数据培训老师给大家介绍一下关于JavaAPI操作HDFS之文件上传实现的详细介绍,希望对同学们学习大数据有所帮助,下面我们一起来看一下吧。

​  HDFS核心类简介

  Configuration类:处理HDFS配置的核心类。

  FileSystem类:

  处理HDFS文件相关操作的核心类,包括对文件夹或文件的创建,删除,查看状态,复制,从本地挪动到HDFS文件系统中等。

  Path类:处理HDFS文件路径。

  IOUtils类:处理HDFS文件读写的工具类。

  核心类中重要方法简介

  1.FileSystemget(URIuri,Configurationconf)

  根据HDFS的URI和配置,创建FileSystem实例

  2.publicbooleanmkdirs(Pathf)throwsIOException

  根据路径创建HDFS文件夹

  3.FSDataOutputStreamcreate(Pathf,booleanoverwrite)

  根据具体的路径创建文件,并且知名是否以重写的方式

  4.abstractbooleandelete(Pathf,booleanrecursive)

  根据路径删除文件

  5.abstractFileStatus[]?listStatus(Pathf)

  根据路径,返回该路径下所有文件夹或文件的状态。

  6.VoidmoveFromLocalFile(Pathsrc,Pathdst)

  将本地路径下的文件,挪动到HDFS的指定路径下

  7.FSDataInputStreamopen(Pathf)

  打开指定路径下的文件内容

  关键步骤说明

  第一步:开发环境准备,包括JDK、开发工具的安装

  第二步:创建项目,配置jar依赖pom.xml文件

  第三步:编写核心代码

  具体代码实战

  最后可通过HDFS的UI界面查看、Hadoopshell两种方式查看文件是否上传到文件系统,以上就是关于JavaAPI操作HDFS之文件上传实现的详细介绍,希望本文对同学们有所帮助。

相关文章

网友评论

    本文标题:扣丁学堂大数据开发JavaAPI操作HDFS之文件上传实现

    本文链接:https://www.haomeiwen.com/subject/gcygnftx.html