美文网首页
OLAP引擎比较ClickHouse VS Doris

OLAP引擎比较ClickHouse VS Doris

作者: 淡淡的小番茄 | 来源:发表于2021-08-15 16:09 被阅读0次

    工作那么多年,也算个老码农了。一直做OLAP相关的工作,从一开始的基于Oracle写汇总存储过程,写过MR代码,到随后的hive、impala、kudu。到现在的ClickHouse。目前比较主流的OLAP解决方案:

    Hadoop体系

    hadoop的技术已经相当成熟,hdfs、yarn估计你遇到的问题都是已经发现和解决的,稳定是真稳定,谁用谁知道。hive绝对是你离线的首选,慢是慢了点。存储使用的hdfs,离线分析可用hive来跑。OLAP的可以使用impala等。存储和计算是分开管理的。

    MPP数据库

    存储和计算都是有MPP数据库来提供的,有代表性的GREENPLUM、CLICKHOUSE、DORIS等。最近ClickHouse比较火,且我们一直用的是它。今天就重点比较下:Doris和ClickHouse。两者定位其实是高度一致的,专注与OLAP分析场景。

    主要从如下几点进行比较:

    1、社区活跃

    Doris的前身是百度的Palo,后贡献给apache社区,相应的商业版本是DorisDB。其官方的性能测试也是对标的ClickHouse。

    ClickHouse截止目前为止:18.2k,相当活跃。

    Doris是2.9K,两者相差太多。

    另外,开源的环境在国内确实不是很好,无法与国外相比较。前端时间听了TiDB大佬的分享,其主要收入还是来源于国外,依托于云,提供技术支持服务,而国内具备大的市场环境,免费使用最后反哺于国外。

    2、功能完善

    物化视图、引擎表、各类函数应有尽有。想比ClickHouse函数和功能更丰富一些,当然doris也能满足你OLAP的绝大多数场景需求。也可以看看ClickHouse2021年的Roadmap,第一个就让人激动人心,不是吗?

    3、运营维护

    ClickHouse的运维一直不太完善,比如节点扩容、脚本执行等等都需要自己手动来做。这方面Doris做的比较好。

    4、SQL支持

    ClickHouse的标准sql支持不太完善,目前社区也在完善这方面的功能,已规划在2021的Roadmap中。而且其推崇大宽表,单表的性能很高。join的实现性能不高,很多时候依赖于你写的SQL,需要特殊注意。这方面Doris做得非常好,支撑标准SQL,尤其在兼容MySQL语法上做了很大的工作。

    5、SSB测试性能

    DorisDB官方给了基于SSB的测试结果比较,也是对标的ClickHouse。DorisDB是doris的商业版本,从测试结果来看性能确实很好,join的底层实现也是比较好的。比开源版本也快了不少,快肯定有快的原因的。从官方的论坛上找到了部分原因:

    最后,真希望国内的开源项目能越做越好,也需要每一个人努力。5年、10年、20年,然后我都老了,该退休了。

    相关文章

      网友评论

          本文标题:OLAP引擎比较ClickHouse VS Doris

          本文链接:https://www.haomeiwen.com/subject/gguubltx.html