美文网首页
Hbase的数据备份策略

Hbase的数据备份策略

作者: wangliang938 | 来源:发表于2017-03-30 15:53 被阅读352次

摘自:http://qindongliang.iteye.com/blog/2366547
Hbase的数据备份策略有:

  • Distcp
  • CopyTable
  • Export/Import
  • Replication
  • Snapshot

下面介绍这几种方式:
一、Distcp(离线备份)
直接备份HDFS数据,备份前需要disable表,在备份完成之前 服务不可用对在线服务类业务不友好

二、CopyTable(热备)
执行命令前,需要创建表,支持时间区间、row区间,改变表名称,改变列簇名称,指定是否copy删除数据等功能,例如:

hbase org.apache.hadoop.hbase.mapreduce.CopyTable -starttime=1265875194289 --endtime=1265878794289 --peer.adr= dstClusterZK:2181:/hbase --families=myOldCf:myNewCf,cf2,cf3 TestTable  

1、同一个集群不同表名称

hbase org.apache.hadoop.hbase.mapreduce.CopyTable --new.name=tableCopy  srcTable  

2、跨集群copy表

hbase org.apache.hadoop.hbase.mapreduce.CopyTable --peer.adr=dstClusterZK:2181:/hbase srcTable  

三、Export/Import(热备+离线)
通过Export导出数据到目标集群的hdfs,再在目标集群执行import导入数据,Export支持指定开始时间和结束时间,因此可以做增量备份。

四、Replication(实时)
通过Hbase的replication机制实现Hbase集群的主从模式实时同步

五、Snapshot(备份实时,恢复需要disable) 个人觉得这是备份里面最经济划算的一个,可以每天在固定时间点对hbase表数据进行快照备份,然后如果出现问题了,可以直接恢复到某个时间点上的数据,适合修复指标计算错误的场景,然后从某个时间点上重新修复。 下面详细说下使用方式:

(1)先建立一个测试表 Java代码
create 'test','cf'
(2)添加数据 Java代码

 > put 'test','a','cf:c1',1  
> put 'test','a','cf:c2',2  
> put 'test','b','cf:c1',3  
> put 'test','b','cf:c2',4  
> put 'test','c','cf:c1',5  
> put 'test','c','cf:c2',6  

(3)创建快照
hbase snapshot create -n test_snapshot -t test
(4)查看快照
list_snapshots
(5)导出到HDFS Java代码

hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot test_snapshot -copy-to  hdfs://user/back/xxx  

(6)从快照恢复数据到原表中
restore _snapshot 'test_snapshot'
(7)从快照中恢复到一个新表中
clone_snapshot 'test_snapshot','test_2'

相关文章

  • Hbase的数据备份策略

    摘自:http://qindongliang.iteye.com/blog/2366547Hbase的数据备份策略...

  • 七,MySQL备份恢复

    1,备份策略设计 备份周期: 备份工具: 备份方式: 逻辑: 物理备份: 备份的策略 数据恢复 数据迁移 2,备份...

  • 玩转HBase快照

    常见的HBase数据迁移和备份的方式 我们知道目前HBase可以通过如下几种方式对数据进行数据的迁移和备份: 1、...

  • 【hbase-维护】hbase日常运维

    1. 备份 执行HBase备份有两种主要策略:完全关闭集群进行备份(离线),以及在运行集群上进行备份(在线)。ht...

  • 一种Hbase数据备份策略及方法

    0.引言 Hbase在大数据处理中地位至关重要,有的公司会将Hbase作为原始数据接入层,那么Hbase的数据备份...

  • hbase数据备份

    火山日常啰嗦今天就讲讲hbase数据备份相关的问题。 讲备份,首先就要知道备份的种类,然后再弄清楚每种备份的操作方...

  • 31备份恢复

    备份恢复备份策略的设计备份周期 根据数据量备份工具 mysqldump,XBK,MEB 备份方式​ ...

  • 使用mysqldump进行逻辑备份

    备份策略 完全备份:备份所有数据(单一或多个库、单一或多张表、整个数据库) 只备份更新数据:差异备份:备份自完全备...

  • MySql备份·完全备份mysqldump

    一、备份相关概念: 备份分为:完全备份、增量备份、差异备份 完全备份策略:可以备份一台数据库服务器上的所有数据、也...

  • hbase集群同步

    由于当前阶段需要对生产集群(cdh5.14,)的hbase数据进行灾备(备份集群cdh6.1),开始调研hbase...

网友评论

      本文标题:Hbase的数据备份策略

      本文链接:https://www.haomeiwen.com/subject/pfhpottx.html