Hbase+ES

作者: sunshineyueli | 来源:发表于2020-02-10 17:22 被阅读0次

    Hbase学习 

    一 :动手搭建环境到 Hbase的各种操作(关于建表的操作)

    二:HBASE原理学习

    一 :目录:1.概念介绍

              2.动手练习(从安装到验证的所有过程)

    1.将Habse来源说明(与bigtable进行对比)。关键是适合非结构化的数据的存储,面向列的。

    2.(1)hbase的环境配置 。 (问题:cm的部署时,各组件的配置会进行统一配置,配置文件在etc下)

     (2)启动后,启动界面下验证hbase,端口60010。  然后在HBase shell中执行增删改查操作。  (问题:hbase shell 的操作语句和sql 语句有无关系。 与UDE的关系)

    二: 目录 

    1.Hbase表的特点:

    面向列:(面向列簇的存储和权限控制,列(簇)的独立检索);稀疏:空列不占用存储空间,列可以设计的很稀疏;

    数据类型单一:数据都是字符串,没有类型

    数据多版本:每个单元的数据可有多个版本,默认版本号是时间戳

    大且无模式:

    2.hbase表的物理模型:

    (1)所有的行都是按照row key的字典排序;表在行的方向上分割成多个region;

    (2)刚开始是只有一个region,随着数据增多,region会等分成两个新的region;region是Hbase中分布式存储和负载均衡的最小单元,不同region分布不同的regionserver;   但region又是由多个store组成,一个store由多个memStore和0至多个storeFile组成,一个在内存中,一个在HDFS中。

    3.架构和基本组件

    1.client 和 zoomkeeper

    包含HBase的接口,并维护cache加快对Hbase的访问。

    存放Hbase 集群的元数据及集群的状态信息。    负责主从节点之间的failover。

    2.Hmaster 和 HregionSever

    管理Hregionserver,实现其均衡负载。 管理和分配Hregion(如region  split时分配新的Hregion)

    存放和管理本地region;读取HDFS,管理Table中的数据。

    ES学习:

    目录: 1.存在的问题

                 2.一些基本概念

    1.目前存在的问题

       (1)启动服务

       (2)创建和得到索引 (put 和 get 命令)\

         (3)ES和数据库的关系 ,他是怎么使用的? 一些命令: curl:-X 后面跟RESTful :GET,POST -d后面跟数据(d = data to send) 数据库的database,就是index ; 数据库的table,就是tag

    2.一些基本概念

    (1)node 与cluster:节点(单个ES)和集群 (多个ES)

     (2)index 和 type的区别 ( index里面的单条记录称为document)

    相关文章

      网友评论

          本文标题:Hbase+ES

          本文链接:https://www.haomeiwen.com/subject/rjqksftx.html