美文网首页
Sqoop 简介

Sqoop 简介

作者: chengruru | 来源:发表于2018-08-11 15:24 被阅读0次
    一、Sqoop(SQL to Hadoop)简介

           Sqoop是Hadoop和关系数据库服务器之间传送数据的一种工具。它是用来从关系数据库如:MySQL,Oracle到Hadoop的HDFS,并从Hadoop的文件系统导出数据到关系数据库。

    二、Sqoop是怎么样工作的?

    下图描述了Sqoop的工作流程:


    sqoop工作流程.jpg
    三、Sqoop导入

           导入工具从RDBMS到HDFS导入单个表。表中的每一行被视为HDFS的记录。所有记录被存储在文本文件的文本数据或者在Avro和序列文件的二进制数据。

    四、Sqoop导出

           导出工具从HDFS导出一组文件到一个RDBMS。作为输入到Sqoop文件包含记录,这被称为在表中的行。那些被读取并解析成一组记录和分隔使用用户指定的分隔符。

    相关文章

      网友评论

          本文标题:Sqoop 简介

          本文链接:https://www.haomeiwen.com/subject/idrdbftx.html