美文网首页
Hadoop集群间数据迁移

Hadoop集群间数据迁移

作者: 朱佳宇 | 来源:发表于2018-07-05 09:54 被阅读0次

数据迁移

1、问题描述

新搭建了一套CDH5.13.1集群,需要将原apache上的数据迁移至新集群。

2、数据迁移工具

Distcp(分布式拷贝)用于大规模集群内部和集群之间拷贝的工具,使用Map/Reduce
实现文件分发。

3、迁移命令

hadoop distcp 数据源 目标数据源
示例:
hadoop distcp hdfs://dsap0:9000/user/hive/warehouse/XX/XX hdfs://dsap7:8020/user/hive/warehouse/XX/XX
注意点:1、该示例中数据源端口为9000,一般默认端口为8020 2、数据源和目标地址均需指定集群namenode的ip 3、distcp命令在新集群中执行(之前网上没人说,在老集群上执行一直OOM)

4、表格修复

1、创建一个和数据源表一样的表格
2、使用msck命令进行表格修复(hive客户端中执行)
示例:
msck repair table 表名

相关文章

  • hdfs文件迁移

    hadoop跨集群之间迁移HDFS数据 不同hadoop集群之间迁移hive数据 hadoop跨集群之间迁移hiv...

  • Hadoop集群间数据迁移

    数据迁移 1、问题描述 新搭建了一套CDH5.13.1集群,需要将原apache上的数据迁移至新集群。 2、数据迁...

  • 2022-10-30 EMR相关知识

    1. 参考文献 EMR(hadoop/hbase/phoenix夸集群数据迁移采坑记录) - 简书 (jiansh...

  • Hadoop深入研究一

    Distcp 用于在两个多个集群之间进行数据的迁移,复制文件 hadoop distcp hdfs://namen...

  • 一篇文章教你自建hadoop集群迁移到EMR

    自建集群要迁移到EMR集群,往往需要迁移已有数据。本文主要介绍hdfs数据和hive meta数据如何迁移。 前置...

  • HDFS搞事情系列(一):跨集群数据迁移

    需求 老集群中的HDFS数据迁移至新集群。 迁移之前需要考虑的事情 1、迁移总数据量有多少?2、新老集群之间的带宽...

  • HBase 的数据迁移importTsv功能

    数据迁移场景举例 Hbase集群装好了,若需要往表中装数据; 数据的备份,如测试集群往生产集群上迁移。 几种HBa...

  • hadoop集群 distcp 缓慢 两个hadoop集群之间使用distcp拷贝时,发现集群之间拷贝数据缓慢,最...

  • hadoop(十九)—Sqoop数据清洗

    上节课学习了Hadoop集群测试,这节课我们一起学习一下Sqoop,Sqoop是专门用来迁移数据的,它可以把数据库...

  • 大数据集群搭建2

    大数据集群搭建 本文档将搭建以下集群 hadoop 集群 zookeeper 集群 hbase 集群 spark ...

网友评论

      本文标题:Hadoop集群间数据迁移

      本文链接:https://www.haomeiwen.com/subject/rtvuuftx.html