美文网首页
MongoDB Redis ES Hbase技术选型

MongoDB Redis ES Hbase技术选型

作者: bigdata张凯翔 | 来源:发表于2021-04-30 09:21 被阅读0次

    大数据的典型特征,包括数据量大、数据类型多、价值密度低等,而具备这样特征的数据,在进入到存储阶段时,就需要根据数据类型及场景,来匹配适当的数据存储解决方案。今天我们来讲讲Java大数据开发当中,必须掌握的四种数据库。
    结构化数据,主要是依靠传统的关系型数据库去存储,比如说Oracle、MySQL、PostgreSQL等,都是关系型数据库的代表。

    非结构化数据(其中也包括半结构化数据),则主要依靠非关系型数据库来完成存储。对于大数据开发者而言,非关系型数据库(NoSQL)也有不同的类型,需要匹配不同的场景需求来进行选择。


    MongoDB最大的特点是表结构灵活可变,字段类型可以随时修改。MongoDB中的每一行数据只是简单的被转化成Json格式后存储,没有表结构的限制。

    没有表结构这一点,对于MongoDB来说,带来了优势,当然也存在一定的缺陷,比如说在多表查询、复杂事务等高级操作上,MongoDB就显得不够优秀了。

    得益于MongoDB的这些特点,MongoDB很适合那些表结构经常改变,数据的逻辑结构又没那么复杂不需要多表查询操作,数据量又比较大的应用场景。


    image.png

    因为我们的业务需要进行多表查询,所以不选择mongoDB

    image.png

    Redis是现在最热门的key-value数据库。Redis的最大特点当然就是key-value存储所带来的简单和高性能了。

    所谓key-value存储,就是每一条记录只包含一个用于查询数据的Key,以及与之对应的存储数据的value,就如同现实生活中的门牌号与住户,而没有诸如表、字段这些常规数据库中必需有的复杂概念,所有的查询都仅仅依赖于key值。

    得益于这种简单的结构,再加上Redis会把所有数据加载到内存中的,Redis相比常规数据库的读写性能得到了极大的提升。并且,Redis还支持数据持久化,list、set等多种数据结构,主从复制备份等功能,堪称简单易用。

    同样地,因为数据结构的简单,Redis对复杂查询的支持也有限,不能支持多列查询、区段查询等。总的来说,Redis更适用于读写性能要求极高,且数据表结构简单、查询条件也同样简单的应用场景。

    结论:

    因为redis不支持复杂查询,不支持多列查询,区段查询
    虽然读写性能很高,但是不适合我们的业务。
    我们业务表结构复杂,查询条件复杂。


    image.png

    ElasticSearch,严格来说,其实不算是数据库,而是搜索引擎,这个产品本身也是围绕搜索来设计的。

    ES的典型优势就是,支持全文搜索,在对中文的支持上也比较友好(单是中文分词器就有很多种)。ES通过建立倒排索引实现全文搜索,以实现对存入ES中的所有数据进行快速检索,就算是非常复杂的聚合查询也可以得到不错的性能。

    当然,ES也同样有不足,最明显的就是字段类型无法修改、写入性能较低和高硬件资源消耗。这就注定了ES不适用于数据价值不高、对写入性能有要求、数据量大而成本受限的场景下。
    参考网址:
    ES字段类型无法修改
    https://blog.csdn.net/Peter_S/article/details/90377027

    https://blog.csdn.net/weixin_41228362/article/details/107382647?utm_medium=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-1.control&dist_request_id=1619667974332_26870&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-1.control

    结论

    这个在我们业务上是可以进行考虑的


    image.png

    HBase作为Hadoop生态当中的重要组件,说是大数据必学,相信没有人会反对。HBase最大的优点,就是对海量数据的支持,以及极强的横向(存储容量)扩展能力。

    Hbase的存储和Redis类似,为每一行数据定义一个key,之后所有的查询都依赖这个key进行。但是Hbase的不同在于,一行数据还可以有非常多的列项,数据会按照列进行分组和存储,同一列的数据存储在同一个地方。

    HBase的列式存储特性带来了海量数据规模的支持和极强的扩展能力,但是也给数据的读取带来很大的局限。由于只有同一列族的数据才会被存放在一起,而且所有的查询都必须要依赖Key,这就使得很多复杂查询难以进行。

    简单来说,HBase适合数据量极大,查询条件简单,列与列之间联系不大的轻查询应用场景。

    针对我们的业务不适合,因为我们需要复杂查询。

    小结一下:
    以上四种,可以说是大数据开发必须掌握的四款数据库,能够满足绝大多数场景下的数据存储需求,不同的数据库适用于不同的场景,如何去选择就要考察开发者的选型能力了。

    相关文章

      网友评论

          本文标题:MongoDB Redis ES Hbase技术选型

          本文链接:https://www.haomeiwen.com/subject/gjzvrltx.html