美文网首页
2.7sqoop加速数据传输

2.7sqoop加速数据传输

作者: NEO_X | 来源:发表于2019-05-31 14:15 被阅读0次

Apache Sqoop Cookbook 英文版-翻译学习!!
更多信息https://blue-shadow.top/

问题

sqoop 是一个强大的工具,能够很好的处理大量的数据传输,但如何使Sqoop更快。

解决方案

对于一些数据库可以通过使用 参数 --direct 以利用直连的优势。

sqoop import \
--connect jdbc:mysql://msyql.example.com/sqoop \
--username sqoop \
--table cities  \
--direct

讨论

直接模式委托不是使用 JDBC 接口来传输数据, 而是将数据传输到数据库供应商提供的本机实用程序。以Mysql为例,
mysqldump和mysqlimport被用于从获取数据或会写数据。对于postgresql,sqoop利用pg_dump的优势来导入数据。使用本地应用工具能够
显著的提高性能,因为它们被优化以提供最佳的传输速度,同时减轻数据库服务器的负担。但有几个限制, 来使用此快速导入,第一:并不是
所有数据库都用可用的本地工具;对于直连这种模式并不是对所有的数据库都有效,目前sqoop只支持对mysql好postgresql的直连.

因为所有数据传输操作都是在生成的 MapReduce 作业内执行的,而且由于数据传输在直连工具的应用程序作用下会延迟数据传输,所以需要
确保所使用的本地应用程序在Hadoop TaskTracker节点上有效,举例来说:在使用Mysql时,在每个TaskTracker服务器上需要同时安装mysqlimport和
mysqldump

直接模式的另一个限制是不支持所有参数,作为该本机实用程序通常产生文本输出, 二进制格式如 SequenceFile 或 Avro将无法工作。
此外, 在以下几种情况下: 自定义转义字符、类型映射、列和行分隔符或 NULL 替换字符串的参数都可能无法被支持。

相关文章

  • 2.7sqoop加速数据传输

    Apache Sqoop Cookbook 英文版-翻译学习!!更多信息https://blue-shadow.t...

  • CDN加速在网络服务中的应用

    CDN加速是不少服务器托管用户使用的服务器数据传输加速方案。不过就现在的技术以及资源来说,提高数据传输速度的方法有...

  • AWS 数据传输加速

    AWS CloudFront 概述 一个CDN服务,加快网页和其它下载全球分布式网络缓存服务器 CloudFron...

  • 计算机基础回顾

    外频、倍频与cpu频率 外频(cpu与外部数据传输速度)倍频(厂商对cpu进行加速)=cpu频率主内存与cpu通讯...

  • Hadoop权威指南-ch4 Hadoop的I/O(2)

    注:本文涉及书中4.2小结 文件压缩 好处:减少存储文件的磁盘空间,加速网络和磁盘的数据传输。 所有的压缩方法都要...

  • CDN都有哪些功能?

    一、CDN网站加速功能:其基本思路是尽可能避开互联网上有可能影响数据传输速度和稳定性的瓶颈和环节,使内容传输的更快...

  • 4G全网通对讲机南极星F9

    4G全网通对讲机南极星F9采用高速数据传输4GLTE独立加速模块,其接收信号更稳定,通信速度更快,通话保密性更强、...

  • ElasticSearch数据传输机制

    ElasticSearch的数据传输服务TransportService ElasticSearch的数据传输服务...

  • 即将到来的5G,新商业规则的重塑机会

    转眼间,3G成为历史,4G沦为主流,5G蓄势待发。智能手机的问世加速了通讯技术的变革,短短数年,数据传输率的成倍增...

  • ###JAVA I/O

    I/O流用于解决设备之间的数据传输问题。比如内存和硬盘之间的数据传输或者网络之间的数据传输 一、字节流的传输 输入...

网友评论

      本文标题:2.7sqoop加速数据传输

      本文链接:https://www.haomeiwen.com/subject/qiwwtctx.html