1. 背景
目前,在数据仓库领域,Hadoop已经是行业标准。包括 HDFS、MapReduce、Hive、Hbase、Impala、Spark 等等 非常多的组件,这些组件各司其职,相得益彰。但是,Hadoop生态的技术组件显得臃肿和复杂、且时效性也不强。
在这个背景下,Click House有了自己的用武之地。
OLAP(多维数据分析)是一个很成熟的技术了。 常见的OLAP的架构包含三类:
ROLAP(Relational OLAP,关系型OLAP)
MOLAP(Multidimensional OLAP,多维型OLAP)
HOLAP(Hybrid OLAP,混合架构的OLAP)
ROLAP是传统关系型数据模型建模,直接使用SQL语句对数据进行GROUP BY聚合。这种方式最为简洁、灵活。但是问题也显而易见,就是数据量大时,查询过程将耗时巨大。
MOLAP是以空间换时间的优化方式,类似于Kylin这类产品,预计算Cube,实现毫秒级的查询反馈。而这种方式问题也很明显,如果维度较多很容易造成数据膨胀爆炸,消耗大量的计算和存储资源。同时,数据在修改时,需要消耗大量精力做数据同步。
HOLAP是混合使用上边两种方式。
通过分析发现,上边几种方式都有自己的弱点,能否解决呢 ? ClickHouse就在解决这两个问题时应运而生。
网友评论