美文网首页
Hive 数据导入 HBase

Hive 数据导入 HBase

作者: alaya_c09d | 来源:发表于2020-01-02 19:54 被阅读0次

https://segmentfault.com/a/1190000011616473

一、Hive 跑批
1.建表

create table  original_tmp_db.hbase_hfile_table(key String, userid string,times string,updatetime string) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n' STORED AS TEXTFILE;

默认第一个字段会作为hbase的rowkey。

2.导入数据

insert into table original_tmp_db.hbase_hfile_table select userid,userid,times,updatetime from original_tmp_db.mskyhlzh_xxxx_wxrank_ckitimes;

将userid插入到列key,作为hbase表的rowkey。

二、生成中间的HFile

hbase  org.apache.hadoop.hbase.mapreduce.ImportTsv    -Dimporttsv.bulk.output=hdfs://namespace1/tmp/rmdb/test/cf  -Dimporttsv.columns="HBASE_ROW_KEY,cf:USERID,cf:TIMES,cf:UPDATETIME"  binlog_ns:hbase_hfile_load_table hdfs://namespace1/apps/hive/warehouse/original_tmp_db.db/hbase_hfile_table

-Dimporttsv.bulk.output : HFile输出目录
-Dimporttsv.columns:HBase表中的列簇、列名称,注意顺序与Hive表一致。
binlog_ns:hbase_hfile_load_table :binlog_ns 名称空间下的hbase_hfile_load_table表
hdfs://namespace1/apps/hive/warehouse/original_tmp_db.db/hbase_hfile_table : 是Hive 表original_tmp_db.hbase_hfile_table的数据路径

ImportTsv 会去读取 Hive表数据目录中的文件,并分析 hbase table 的region 分布, 生成对应region的hfile, 放到 -Dimporttsv.bulk.output目录下

三、通过bulkload 加载HFile到HBase表

读取HFile目录下文件,加载到HBase表中

     
hbase  org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles hdfs://namespace1/tmp/rmdb/test/cf  binlog_ns:hbase_hfile_load_table

相关文章

  • Hive 大表数据导入 HBase

    本文简单介绍 HBase 的数据导入工具 ImportTSV 。通过一次将 hive 大表导入 HBase 的实战...

  • Sqoop的简单使用案例

    导入数据 在Sqoop中,“导入”概念指:从非大数据集群(RDBMS)向大数据集群(HDFS,HIVE,HBASE...

  • Hive 数据导入 HBase

    https://segmentfault.com/a/1190000011616473 一、Hive 跑批1.建表...

  • 尚硅谷大数据技术之Sqoop

    5.2.5 命令&参数:import将关系型数据库中的数据导入到HDFS(包括Hive,HBase)中,如果导入的...

  • spark读取Hive

    导入依赖 导入关键的依赖包 启动hive支持 hive与hbase关联,可以作为一种查询hbase的方式 创建hi...

  • Sqoop安装

    Sqoop是Hadoop生态里,实现Hive、Hbase等大数据数据库与MySQL、Oracle导入导出的工具。其...

  • hbase,hive随笔

    Hbase,hive关系 在大数据体系中,hbase,hive处于协作关系,Hbase主要解决实时数据查询问题,H...

  • Sqoop之环境搭建

    本文介绍了使用Sqoop导入MYSQL数据到Hive&Hbase之中。 主要内容: 1.下载 1.下载 下载地址 ...

  • 2018-07-13 hbase

    hive与hbase如果hive相当与hadop中的传统关系数据数据库,那么hbase就是hadoop中的nosq...

  • Hive和Hbase的各自适用场景

    先放结论:Hbase和Hive在大数据架构中处在不同位置,Hbase主要解决实时数据查询问题,Hive主要解决数据...

网友评论

      本文标题:Hive 数据导入 HBase

      本文链接:https://www.haomeiwen.com/subject/ltoooctx.html