美文网首页
Sqoop简介与原理

Sqoop简介与原理

作者: Movle | 来源:发表于2020-05-09 21:06 被阅读0次

一.Sqoop简介

Apache Sqoop(TM)是一种旨在有效地在Apache Hadoop和诸如关系数据库等结构化数据存储之间传输大量数据的工具。

Sqoop于2012年3月孵化出来,现在是一个顶级的Apache项目。

请注意,1.99.7与1.4.6不兼容,且没有特征不完整,它并不打算用于生产部署。

二.Sqoop原理

将导入或导出命令翻译成mapreduce程序来实现。

在翻译出的mapreduce中主要是对inputformat和outputformat进行定制。

三.架构:

1.区别

(1)flume数据采集 采集日志数据
(2)sqoop数据迁移 hdfs->mysql
(3)azkaban任务调度 flume->hdfs->shell->hive->sql->BI

  • sqoop数据迁移=mapreduce 处理离线数据 整个过程就是数据导入处理导出过程 直接使用map
2.sqoop作用:
  • sqoop作用:简化开发

相关文章

  • Sqoop简介与原理

    一.Sqoop简介 Apache Sqoop(TM)是一种旨在有效地在Apache Hadoop和诸如关系数据库等...

  • Sqoop简介原理安装

    Sqoop简介 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、post...

  • Hadoop-Sqoop安装

    Sqoop简介 算是一个Hadoop和其他数据库存储之间的一个数据传输工具 sqoop的原理 通过shell ,底...

  • 尚硅谷大数据技术之Sqoop

    第1章 Sqoop简介 Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、...

  • Sqoop简介

    1、什么是Sqoop Apache Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(...

  • Sqoop 简介

    一、Sqoop(SQL to Hadoop)简介 Sqoop是Hadoop和关系数据库服务器之间传送数据的一种工具...

  • Sqoop-client源码

    sqoop-client类 简介 sqoop2的架构是C-S架构的。sqoop2的用户都必须通过sqoop-cli...

  • Sqoop 入门

    1 Sqoop 简介 Sqoop 是一款开源的工具,主要用于在 Hadoop 与传统的数据库间进行数据的传递,可以...

  • sqoop之hive数据仓库和oracle数据库数据转换

    1 sqoop简介 1.1 什么是sqoop? sqoop(发音:skup)是一款开源的工具,主要用于在Hadoo...

  • Sqoop 工作原理

    Sqoop架构 Sqoop import原理 从传统数据库获取元数据信息(schema、table、field、f...

网友评论

      本文标题:Sqoop简介与原理

      本文链接:https://www.haomeiwen.com/subject/zxwlnhtx.html