HBase 数据迁移

HBase 数据迁移

作者: Gallin_Qiu | 来源:发表于2017-11-03 15:08 被阅读0次

数据来源

logs
RDBMS

ways of move data into HBase

HBase put API
HBase bulk load tool
自定义MR job
最常见的
RDBMS抽取数据
- JDBC,通用，实时性（全量/增量）
HBase插入数据
- 多线程，通用
kettle

import TSV

使用bulkload讲file装换成HFile后再上传：通常MapReduce在写HBase时使用的是tableOutPutFormat方式，在reduce中直接生成put对象写入HBase，该方式在大量的数据写入时效率低下，频繁使用flush，split，compact等大量I/O操作，并对HBase节点的稳定性造成一定影响，（GC时间过长，相应变慢，到直接点超时退出，引起一系列连锁反应）
HBase支持bulk load的入库方式，是利用HBase的数据信息按照特定格式存储在HDFS上的这一原理，直接在HDFS中生成持久化的HFile数据格式文件上传，即完成巨量数据快速入库的办法，配合MR使用，快捷高效，而且不占用region的资源，降低对HBase节点的压力
- 消除了HBase集群的插入压力
- 提高了job的运行速度

相关文章

网友评论

我爱编程

本文标题：HBase 数据迁移

本文链接：https://www.haomeiwen.com/subject/jpetmxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

我爱编程

关于我们|服务条款|联系我们|HBase 数据迁移|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！