美文网首页
Hive分区表跨集群迁移

Hive分区表跨集群迁移

作者: 香山上的麻雀 | 来源:发表于2020-02-21 13:52 被阅读0次

(1)先从集群1使用hadoop fs -get将文件下载到本地磁盘
(2)再使用hadoop fs -put将数据上传至集群2的hdfs上
(3)在集群2上创建语句一模一样的表
(4)给集群2的同名hive表添加分区,数据就会自动加载到Hive表中

添加分区可写一个脚本:

  • 首先在集群1下,shell命令行执行 hive -e "show partitions table_name" > partitions.txt
    得到类似如下内容:
day=17987/event=$AppClick
day=17987/event=$AppEnd
day=17987/event=$AppStart
day=17987/event=$AppStartPassively
day=17987/event=$AppViewScreen
day=17987/event=$SignUp
day=17987/event=$WebClick

我这里day是int类型的,event是字符串类型的,
然后写如下脚本执行:

import os

file = open("partitions.txt")
for line in file:
    splits = line.split("/")
    events = splits[1].split("=")
    partition = splits[0] + "," + events[0] + "=\"" + events[1].strip() + "\""
    command = "hive -e 'alter table analysis.events_parquet_mtmy add partition("+partition+");'"
    os.system(command)

在集群2上执行即可。

相关文章

  • hdfs文件迁移

    hadoop跨集群之间迁移HDFS数据 不同hadoop集群之间迁移hive数据 hadoop跨集群之间迁移hiv...

  • Hive分区表跨集群迁移

    (1)先从集群1使用hadoop fs -get将文件下载到本地磁盘(2)再使用hadoop fs -put将数据...

  • hive 跨集群迁移表

    1. export table xxx to '/tmp/xxxx'; 2.hadoop fs - get /tm...

  • HBase跨集群迁移调研方案

    HBase跨集群迁移调研方案回顾 迁移目的 HBase跨集群平滑迁移 方案 方案一 方案二 操作命令 snapsh...

  • 一篇文章教你自建hadoop集群迁移到EMR

    自建集群要迁移到EMR集群,往往需要迁移已有数据。本文主要介绍hdfs数据和hive meta数据如何迁移。 前置...

  • hive的这些事(一)——hive数据迁移

    比如需要把生产的hive集群数据迁移到另一个集群,hive提供了2个命令工具,可以实现表的批量迁移。 [expor...

  • Hive Migrate

    一、orc分区表迁移 复制元信息,hive同版本:可以恢复 复制元信息,hive高版本:可以恢复 不复制元信息,h...

  • hive集群迁移

    一、主要任务 1、建立hive表2、建立分区3、验证数据4、配置调度任务5、校验任务 二、hive建表语句 获取所...

  • Elasticsearch数据迁移与集群容灾

    本文讨论如何跨集群迁移ES数据以及如何实现ES的同城跨机房容灾和异地容灾。 跨集群数据迁移 在ES的生产实践中,往...

  • 在线不停服迁移自建ES集群至腾讯云ES

    背景 在之前的文章Elasticsearch跨集群数据迁移之离线迁移中,我们介绍了如何在离线场景下把自建的ES集群...

网友评论

      本文标题:Hive分区表跨集群迁移

      本文链接:https://www.haomeiwen.com/subject/yijcqhtx.html