Hbase学习
一 :动手搭建环境到 Hbase的各种操作(关于建表的操作)
二:HBASE原理学习
一 :目录:1.概念介绍
2.动手练习(从安装到验证的所有过程)
1.将Habse来源说明(与bigtable进行对比)。关键是适合非结构化的数据的存储,面向列的。
2.(1)hbase的环境配置 。 (问题:cm的部署时,各组件的配置会进行统一配置,配置文件在etc下)
(2)启动后,启动界面下验证hbase,端口60010。 然后在HBase shell中执行增删改查操作。 (问题:hbase shell 的操作语句和sql 语句有无关系。 与UDE的关系)
二: 目录
1.Hbase表的特点:
面向列:(面向列簇的存储和权限控制,列(簇)的独立检索);稀疏:空列不占用存储空间,列可以设计的很稀疏;
数据类型单一:数据都是字符串,没有类型
数据多版本:每个单元的数据可有多个版本,默认版本号是时间戳
大且无模式:
2.hbase表的物理模型:
(1)所有的行都是按照row key的字典排序;表在行的方向上分割成多个region;
(2)刚开始是只有一个region,随着数据增多,region会等分成两个新的region;region是Hbase中分布式存储和负载均衡的最小单元,不同region分布不同的regionserver; 但region又是由多个store组成,一个store由多个memStore和0至多个storeFile组成,一个在内存中,一个在HDFS中。
3.架构和基本组件
1.client 和 zoomkeeper
包含HBase的接口,并维护cache加快对Hbase的访问。
存放Hbase 集群的元数据及集群的状态信息。 负责主从节点之间的failover。
2.Hmaster 和 HregionSever
管理Hregionserver,实现其均衡负载。 管理和分配Hregion(如region split时分配新的Hregion)
存放和管理本地region;读取HDFS,管理Table中的数据。

ES学习:
目录: 1.存在的问题
2.一些基本概念
1.目前存在的问题
(1)启动服务
(2)创建和得到索引 (put 和 get 命令)\
(3)ES和数据库的关系 ,他是怎么使用的? 一些命令: curl:-X 后面跟RESTful :GET,POST -d后面跟数据(d = data to send) 数据库的database,就是index ; 数据库的table,就是tag
2.一些基本概念
(1)node 与cluster:节点(单个ES)和集群 (多个ES)
(2)index 和 type的区别 ( index里面的单条记录称为document)
网友评论