美文网首页工作生活
HBase | 相对于rdbms

HBase | 相对于rdbms

作者: icebreakeros | 来源:发表于2019-07-02 17:52 被阅读0次

相对于rdbms

hbase架构

hbase vs rdbms

  • 数据类型
    HBase只有简单的字符串类型
  • 数据操作
    HBase只有简单的增、删、改、查等操作,没有表之间的关联
  • 存储模式
    HBase基于列存储的,每个列族由几个文件保存
  • 数据维护
    HBase不是真正意义上的更新数据
  • 可伸缩性
  • 应用场景
    Hbase适合大量插入同时又有读的情况
    HBase很适合寻找按照时间排序top n的场景
  • HBase的瓶颈是硬盘传输速度,RDBMS的瓶颈是硬盘寻道时间
  • 索引不同造成行为的差异

传统数据库的行式存储

  • 数据存放在数据文件内
  • 数据文件的基本组成单位:块/页
  • 块内结构:块头、数据区

行式存储的问题

  • 读某个列必须读入整行
  • 行不等长,修改数据可能导致行迁移
  • 行数据较多时可能导致行链

行标识访问:B树索引

B树索引

B树索引的缺点
空间代价,创建时间代价,维护代价
重复值多时影响效率

B树

hbase和mapreduce

  • hbase集成了mapreduce框架,对表中大量数据进行并行处理
  • hbasemapreduce每个阶段提供了相应的类用来处理表数据
  • InputFormat
    • hbase实现了TableInputFormatBase类,该类提供了对表数据的大部分操作,其子类TableInputFormat则提供了完整的实现,用于处理表数据并声称键值对
  • Mapper类和Reducer
    • hbase实现了TableMapper类和TableReducer
  • OutputFormat
    • hbase实现的TableOutputFormat将输出的<key,value>对写到指定的hbase表中

相关文章

  • HBase | 相对于rdbms

    相对于rdbms hbase vs rdbms 数据类型HBase只有简单的字符串类型 数据操作HBase只有简单...

  • HBase 数据迁移

    数据来源 logs RDBMS ways of move data into HBase HBase put AP...

  • Hbase与RDBMS对比

    参考HBase: Designed for Distribution, Scale, and Speed 1. R...

  • Sqoop集成HBase:Mysql TO HBase

    一.Sqoop集成HBase 1.利用Sqoop在HBase和RDBMS中进行数据的转储。 2.相关参数: 参数描...

  • Kv for Hbase

    Hbase是一种NoSQL数据库,这意味着它不像传统的RDBMS数据库那样支持SQL作为查询语言。Hbase是一种...

  • 导出数据

    在Sqoop中,“导出”概念指:从大数据集群(HDFS,HIVE,HBASE)向非大数据集群(RDBMS)中传输数...

  • hbase shell

    namespace 在HBase中,namespace命名空间指对一组表的逻辑分组,类似RDBMS中的databa...

  • Sqoop的简单使用案例

    导入数据 在Sqoop中,“导入”概念指:从非大数据集群(RDBMS)向大数据集群(HDFS,HIVE,HBASE...

  • HBase (一) 简介

    背景 HBase是Apache顶级项目Hadoop的子项目。与传统的RDBMS关系型数据库(Oracle, MyS...

  • MongoDB快速入门指南与docker-compose快体验

    MongoDB快速入门指南与docker-compose快体验 MongoDB相对于RDBMS的优势 模式少 -M...

网友评论

    本文标题:HBase | 相对于rdbms

    本文链接:https://www.haomeiwen.com/subject/qopthctx.html