Hbase初窥

作者: Gallin_Qiu | 来源:发表于2017-11-02 10:51 被阅读0次

Hbase初窥
初窥
初窥
初窥南京
初窥HTTP
初窥Scrapy
mongodb初窥
RxSwift初窥
block初窥
AsyncDisplayKit 初窥

Hbase能做什么

海量数据的存储
海量数据的查询

企业数据海量查询

项目需求功能

海量数据
实时查询
场景复杂

数据采集
sqoop（flume）
kettle

Hbase基本信息

企业用的比较多的版本0.98，0.98是针对hadoop 2.2编译的，需要替换jar包
只有表名和列簇，rowkey唯一

Hbase体系架构

Master
RegionServer

部署

安装解压后，配置文件再conf目录下
hbase-env.sh
hbase-site.xml
regionserver
启动
start-hbase.sh
查看端口 60010 （如果发现Hadoop版本不对，需要手动更换jar包）
停止stop-hbase.sh

hbase shell使用

进入： hbase shell
查看表：list
查看帮助 help 'command'
查看表信息：describle tablename
只有插入和查询
插入：put 'tablename' '列簇' '列名' 'value'
查询：

依据rowkey进行查询 get
get 'tablename' '列簇'
范围查询：scan range
scan

Hbase 物理模型

table中的所有行都按照rowkey的字典序进行排序
table在行的方向上分割为多个Region
region是按照大小分割的，每个表开始时只有一个region随着数据增大增大
region是分布式存储的最小单元
存储的最小单元是cell

Hbase 数据写入流程：

put -》cell
wal 预写日志
memstore
spool -》hdfs

总结：

1 查询时效：准实时，秒级别
2 基于HDFS：数据安全性，普通商用机即可
3 协作框架zookeeper
4 table：columnfamily，rowkey
5 列式存储 nosql=not only sql

region
默认情况下，会创建一个表，只有一个region
startkey：null
endkey：null

网友评论

本文标题：Hbase初窥

本文链接：https://www.haomeiwen.com/subject/eiqopxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Hbase初窥

Hbase能做什么

企业数据海量查询

Hbase体系架构

部署

hbase shell使用

Hbase 物理模型

总结：

相关文章

Hbase初窥

初窥

初窥

初窥南京

初窥HTTP

初窥Scrapy

mongodb初窥

RxSwift初窥

block初窥

AsyncDisplayKit 初窥

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读