提供数据的随机读写和实时访问,实现对表数据的读写功能
基于HDFS,分布式,面向列的开源数据库
主键(ROW key):用来检索记录的主键(主键为任意字符串,最大长度64KB,按字典顺序存储,在hbase内部保存为字节数组)
访问hbase表中的行,有三种方式:通过单个Row key访问;通过ROW key的range;全表扫描
列族(Column Family):列族在创建表的时候声明,一个列族可以包含多个列,列中的数据都是以二进制形式存在,没有数据类型;列族是一些列的集合;一个列族所有列成员是有着相同的前缀
时间戳和存储单元(Timestamp and Cell):hbase中通过row和columns确定的为一个存储单元称为Cell,每个cell都保存着同一份数据的多个版本;在写入数据时,时间戳可以由hbase自动赋值,也可以显示赋值;在每个cell中,不同版本的数据按照时间的倒序排序;{row,column,version}就是hbase中的一个cell
Hbase存储细节:每个列族存储哎HDFS上的一个单独的文件夹中;Key和version number会在每个列族中存储一份;空值不会保存
网友评论