美文网首页大数据
从Linux服务器本地写文件到hdfs

从Linux服务器本地写文件到hdfs

作者: cosine90 | 来源:发表于2018-08-06 10:09 被阅读8次

使用python中的impala package中的executemany方法向hive table写入数据十分慢。

可以使用pyhdfs向 hdfs文件系统中写入文件,然后加载到table的分区实现。

环境:ubuntu 16.04, anaconda3,python3.6

安装: pip install pyhdfs   (先which pip,看一下是否对应anaconda3下的bin中的pip)

连接hdfs:

from pyhdfs import HdfsClient

client = HdfsClient(hosts='10.10.10.10:50070',timeout=60, max_tries=20,user_name=default)

端口号是50070,或者对应hdfs设置的webhdfs的端口号,需要用户名,无需密码

用client.mkdirs(path),然后用client.copy_from_local(localfile,path)把本地文件拷贝到hdfs中,如果中途报错,

确保:

1.hdfs服务器上的webhdfs打开

Figure. 1

2. 将hdfs各个节点ip和domain加入到本地系统的hosts中:

Figure. 2

最后别忘了,用alter table把分区加载到hdfs table中。

相关文章

  • 从Linux服务器本地写文件到hdfs

    使用python中的impala package中的executemany方法向hive table写入数据十分慢...

  • Hadoop Java API

    获取HDFS客户端对象 创建文件夹 读取HDFS文件 创建文件、写文件 重命名文件 从本地复制文件到hdfs 复制...

  • 关于HDFS的几个操作纯代码

    一.功能实现: 1:将本地文件上传到HDFS上 2:从HDFS上读取文件到本地 3:删除HDFS上的文件 4:遍历...

  • 通过ssh与服务器复制文件

    从服务器复制文件到本地 从本地复制文件到服务器

  • rz/sz命令

    在使用Linux系统的时候,我们经常需要将本地的文件上传到服务器或者从服务器上下载文件到本地,rz / sz命令很...

  • Linux系统下安装rz/sz命令及使用说明

    对于经常使用Linux系统的人员来说,少不了将本地的文件上传到服务器或者从服务器上下载文件到本地,rz / sz命...

  • Linux系统下安装rz/sz命令及使用说明

    对于经常使用Linux系统的人员来说,少不了将本地的文件上传到服务器或者从服务器上下载文件到本地,rz / sz...

  • Linux系统下安装rz,sz命令及使用说明

    对于经常使用Linux系统的人员来说,少不了将本地的文件上传到服务器或者从服务器上下载文件到本地,rz / sz命...

  • 实用linux命令

    拷包到其他机器 linux下面将某个文件发送到另外一台linux机器 从远程服务器复制到本地服务器:从远程复制到本...

  • rz/sz

    linux命令 sz 传输文件从服务器到本地报错�*B00000000000000 https://www.jia...

网友评论

    本文标题:从Linux服务器本地写文件到hdfs

    本文链接:https://www.haomeiwen.com/subject/gxjuvftx.html