绪
Sqoop:SQL-to-Hadoop
- 连接传统关系型数据库和
Hadoop
的桥梁- 把关系型数据库的数据导入到
Hadoop
与其相关的系统(如HBase
和Hive
)中 - 把数据从
Hadoop
系统里抽取并导出到关系型数据库里
- 把关系型数据库的数据导入到
- 利用
MapReduce
加快数据传输速度 - 批处理方式进行数据传输
sqoop1架构
sqoop1架构sqoop1存在的问题
基于命令行的操作方式易于出错,且不安全
数据传输和数据格式是紧耦合的,这使得connector
无法支持所有数据格式
安全密钥是暴露出来的,非常不安全
传统数据库的用户名和密码等
Sqoop
安装需要root
权限
Connector
必须符合JDBC
模型,并使用通用的JDBC
词汇
sqoop2架构
sqoop2架构sqoop2优势
- 多种交互方式:命令行、
Web UI
、REST API
-
Connector
集中化安装:所有Connector
安装在Sqoop Server
上 - 权限管理机制:可配置管理员、使用者等角色
-
Connector
规范化
不再包含数据传输,格式转换、与Hive
、Hbase
交互等功能
仅负责数据读写
sqoop2比sqoop1的改进
引入sqoop server
,集中化管理Connector
等
多种访问方式:CLI,Web UI,REST API
引入基于角色的安全机制
网友评论