前言:
什么是HBase?
HBase是一种NoSQL存储系统:专门设计用来快速随机读写大规模数据,HBase运行在普通商业服务器上,可以平滑扩展,以支持从中等规模到数十亿行,数百万列的数据集。
HBase是一种数据库:Hadoop数据库,它经常被描述为一种稀疏的,分布式的,持久化的,多维有序映射,它基于行键(rowkey),列键(column key)和时间戳(timestamp)建立索引,人们会说它是一种键值(key value)存储,面向列族的数据库有时也是种储多时间戳版本映射的数据库。所有这些描述都是正确的。但是从根本上讲,它是个可以随机访向的存储和检索数据的平台,也就是说,你可以按照需要写人数据,然后再按照以随机访向的存储和检索数据的平台,也就是说,你可以按照需要写人数据,然后再按照解析好的日志文件或者全部产品目录及其用户评价。它也可以存储非结构化数据,只要不是特别大。它不介意数据类型。允许动态的、灵活的数据模型。并不限制存储的数据的种类。
HBase不同于你可能已经习惯的关系型数据库。它不用SQL语言,也不用强调之间的关系。HBase不允许跨行的事务。你可以在一行的某一列存储- 一个整数而在另一行的同- -列存储字符串。
HBase被设计成在一一个服务 器集群上运行。而不是单台服务器。集群可以由普通硬件构建;当把更多机器加入集群时,HBase可以相应地横向扩展。集群中的每个节点提供一部分存储空间。-部分缓存和-部分计算能力,因此HBase难以想象地灵活和宽容。因为没有独一无二的节点,所以某一台机器坏了,只需简单地用另一台机器替换即可。这意味着- - -种强大的,可扩展的使用数据的方式。到现在为止。一直没有官方数据说明它的扩展上限。
HBase 无处不在: Face book 苹果、 Salesforce.com Adobe 、雅虎、 Bloomberg华为、 Gap和许多其他公司都在使用它。谷歌采用了 HBase API为其提供公共云Bigtable ,这也是HBase受欢迎的 个证据。
为了让大家可以更好的学习HBase,目前小编把HBase整理划分为17个视频2大文档共计4.2个G,帮助您从入门开始到实践,一步一步把HBase摸透
HBase学习路线
学习HBase需要的15个视频两大技术文档
HBase两大技术文档
HBase应用架构
HBase是Hadoop Database的简称,基于Google Bigtable 实现的开源、分布式、可伸缩的列式存储数据库,自其诞生之日起,就受到业界的追捧,而今已成为了Hadoop生态圈和各公司大数据平台不可或缺的组成部分。时间序列数据库Opentsdb、阿里的HQueue. OLAP分析引擎Kylin等很多大数据开源项目也都是基于HBase的。
目录:
第一部分:HBase概述
第一章:什么是HAbse
第二章:HAbes原理
第三章:HAbe生态系统
第四章:HBase规模预估和调优概述
第五章:环境设置
第二部分:用例
第六章用例: HBase作为一个记录系统
第七章:底层存储引擎的实现
第八章用例:近实时事件处理
第九章近实时实现事件处理
第十章:用例:HBase作为主数据管理工具
第十一章:主数据管理工具HBase 的实现
第十二章:用例:文档存储
第十三章文档存储的实现
第三部分:疑难问题的定位和排错
第十四章:region 过多
第十五章:章列族过多
第十六章:热点
第十七章:超时和垃圾回收
第十八章:HBCK和不一致
HBase实战
《HBase实战》分为4个部分。前两个部分介绍如何使用HBase。在6章的筲幅里,你会从一个新手成长为可以在HBase上熟练编程的人。在这个过程中,你会学到HBae的基本原理,模式设计以及如何使用HBase的高级特性。最重要的是,你将学会用HBase的方式思考。第三部分有两章,介绍一些应用示例,让你体会- 下实际应用是什么样子。第四部分指导你如何把原型开发系统升级为羽翼丰满的生产系统。
第一部分:
第1章总体介绍Hadoop. HBase和INoSQL的起源。我们将介绍HBse是什么和不是什么,把HBase和其他NoSQL数据库进行对比,介绍一些通用的使用场景。我们会帮你判断对于你的项目和公司来说HBase是否是正确的技术选择。第1章包括简单安装HBase和开始存储一点儿数据。
第2章开始运行一个示例应用。通过这个例子,我们探讨使用HBase的基础知识。包括创建表。存取数据以及HBase的数据模型。我们也会深人探讨HBase的内部工作机制,理解HBase如何组织数据,以及在你的应用中如何利用这些知识。
第3章作为-个分布式系统重新介绍HBase.本章探讨HBase. Hadoop和ZooKeeper之间的关系。你会学到HBase的分布式架构以及如何转换成- -个强大的分布式数据系统。动手练习示例中会探讨在HBase.上使用Haloop MapReduce的使用场景。
第二部分:
第4章专门针对HBase模式设计。我们用示例应用来探讨这个复杂的主题。你会看到表设计决策是如何影响应用的,以及如何避免常见错误。我们会把一些关感型数据率知识映射到HBase世界里。你还会看到如何使用服务器壩过滤器( server-side fiter )来进一步完善模式设计。这一章也涵盖HBase的高级物理配置选项。
第5章介绍协处理器( corocessrr。这是-种把计算推向HBase集群的计算机制。你会用两种不同的方式扩展示例应用,在集群上构建应用的新特性。
第6章全面、快速地介绍可选的HBase客户端。HBase 是用Java编写的,但这井不意味着你的应用必须是用Java编写的。你可以用各种编程语言和不同的网络协议来访间示例应用。
第三部分:
第7章开始,将开始构建- -个真实的、 可以投入生产环境的应用系统。你会了解这个应用系统打算解决的问题和特别的挑战。然后我们深人到实现过程中。在技术细节上做全面考虑。也就是说,从前端到后端全面探讨如何在HBase上搭建应用系统。
第8章介绍如何在- - 个新领城里使用HBase我们将带你快速进入这个新领城一GIs.然后教你如何基于HBase使用- "种可扩展的方式来面对这个领城里特别的挑战。这一章的焦点在于针对特定领域的模式设计以及最大化利用扫描( scan )和过滤器( filter )特性。之前可以没有GIS经验,但是要准备好充分运用前面章节学习的知识。
第四部分:
第9章将部署你的HBase集群。从头开始,我们教你如何着手进行HBase部署。这一章将探讨硬件的种类。数量和如何分配硬件。考虑云服务吗?我们也会谈到。硬件确定以后,我们为你介绍如何为一个基本 部署配置集群,如何让集群正常启动运行。
第10章将把你的部署升级到生产水平。我们教你通过参数和监控工具来监控集群。你会了解到如何根据你的应用负载来进一步优化集群的性能。 我们教你如何管理集群,如何保持集群健康运行,有问题时如何诊断和处理,有需要时如何升级,等等。你将学习使用附带的工具来管理数据的备份和恢复,以及如何配置多集群间的复制工作。
目录:
第一章:HBase介绍
第二章:入门
第三章:分布式的 HBase, HDFS和MapReduce
第四章:HBase表设计
第五章:使用协处理器扩展
第六章:其他HBase客户端选择
第七章:通过实例学习HBase:OpenTSDB
第八章:在HBase上查询地理信息系统
第九章:部署HBase
第十章:运维
HBase入门到实践15大视频
1.hbase-原理a_1
2.hbase-原理b_1
3.hbase-伪分布式、命令
4.hbase-完全分布式搭建
5.hbase-代码a
6.hbase-代码b
7. hbase完全分布式安装
8. hbase javaapi
9.hbase-表设计a
10.hbase-表设计b
11.hbase-表设计c
12.hbase-protobuf-a
13.hbase-protobuf-b
14.hbase-优化
15.hbase-mr
网友评论