美文网首页
Hbase初窥

Hbase初窥

作者: Gallin_Qiu | 来源:发表于2017-11-02 10:51 被阅读0次

Hbase能做什么

  • 海量数据的存储
  • 海量数据的查询

企业数据海量查询

项目需求功能

  • 海量数据
  • 实时查询
  • 场景复杂

数据采集
sqoop(flume)
kettle

Hbase基本信息

  • 企业用的比较多的版本0.98,0.98是针对hadoop 2.2编译的,需要替换jar包
  • 只有表名和列簇,rowkey唯一

Hbase体系架构

Master
RegionServer

部署

  • 安装解压后,配置文件再conf目录下
    hbase-env.sh
    hbase-site.xml
    regionserver
  • 启动
    start-hbase.sh
  • 查看端口 60010 (如果发现Hadoop版本不对,需要手动更换jar包)
  • 停止stop-hbase.sh

hbase shell使用

进入: hbase shell
查看表 :list
查看帮助 help 'command'
查看表信息 :describle tablename
只有插入和查询
插入put 'tablename' '列簇' '列名' 'value'
查询

  • 依据rowkey进行查询 get
    get 'tablename' '列簇'
  • 范围查询:scan range
  • scan

Hbase 物理模型

  • table中的所有行都按照rowkey的字典序进行排序
  • table在行的方向上分割为多个Region
  • region是按照大小分割的,每个表开始时只有一个region随着数据增大增大
  • region是分布式存储的最小单元
  • 存储的最小单元是cell

Hbase 数据写入流程

  • put -》cell
  • wal 预写日志
  • memstore
  • spool -》hdfs

总结:

1 查询时效:准实时,秒级别
2 基于HDFS:数据安全性,普通商用机即可
3 协作框架zookeeper
4 table:columnfamily,rowkey
5 列式存储 nosql=not only sql

region
默认情况下,会创建一个表,只有一个region
startkey:null
endkey:null

相关文章

  • Hbase初窥

    Hbase能做什么 海量数据的存储 海量数据的查询 企业数据海量查询 项目需求功能 海量数据 实时查询 场景复杂 ...

  • 初窥

    初窥世界的美好 白的风 白的肌肤 和盈盈一握的腰肢 在你的头发里 有一个蓝色大海的梦 蓝的帆船和蓝的浪花 自然是美...

  • 初窥

    这个积分管理项目已经到收尾的阶段了,感受良多。 对于错误处理这方面这周我的规划也更为清楚一些了。明天如果能够预期结...

  • 初窥南京

    古鸡鸣寺门外,一条长满爬山虎的墙。 城墙下的绿植。 1912街区,没有什么能过阻挡,我对自由的向往。 午后墙壁上斑...

  • 初窥HTTP

    要知道HTTP肯定要先知道WWW,下面我用思维导图来介绍下: 1,弄懂了上图的关系,接下来着重介绍HTTP。 先介...

  • 初窥Scrapy

    Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据...

  • mongodb初窥

    启动MongoDB服务:在 MongoDB 安装目录的 bin 目录下执行mongod show dbs -- 显...

  • RxSwift初窥

    前言 很久一段时间没写博客了,一方面是自己各种事情折腾,二是新项目开始用Swift了,边学边做忙死了,现在终于快忙...

  • block初窥

    一.block的简单使用 1.block声明 block变量的声明格式为: 返回值类型 (^block名字)(参数...

  • AsyncDisplayKit 初窥

    了解 AsyncDisplayKit AsyncDisplayKit的基本单位是节点 Node。一个Asdispl...

网友评论

      本文标题:Hbase初窥

      本文链接:https://www.haomeiwen.com/subject/eiqopxtx.html