Redash初学者笔记
为什么是Redash?
2018年,机缘巧合之下,我的职业生涯开始了向大数据产品经理转型的、痛并快乐的过程。
转型过程中,我开始推动BI工具在大数据产品中的集成,中间经过一段时间的评估与权衡,Redash是最终的选择。在Redash初学者笔记这个文章系列里,我将把我在探索Redash这个BI工具的使用过程中一些心得体会进行记录。
第一篇记录里,我准备说说为什么我会选择了Redash。
在开始BI工具的选型时,考虑到成本、保密性等实际情况,定下了只考虑开源软件的大方向,这就将Tableau、PowerBI、FineBI等较为成熟的商业产品排除了。之后,经过初步筛选,范围圈定在Superset、Metabase、Redash这三者之间了。
先说Superset,虽然这个是Airbnb开源的产品,感觉上有大公司背书挺牛的,但其实使用起来很多不尽人意的地方。首先是文档,只能说是非常简陋了;其次是技术架构上,Superset后端使用的是Python,这个我觉得挺好的,但是还用了一个叫做Flask AppBuilder(简称FAB)的开源组件,我不是一个高水平的开发人员,但经过与公司的研发探讨后,觉得这个组件挺陌生小众的,迭代维护也不是很活跃,真正用起来估计很多坑,最后决定放弃了。
其次是Metabase。其实我个人来说,是很喜欢这个开源产品的,无论是文档、UI风格、还是操作,都让人觉得非常舒服。但是有几点问题让我最后放弃了Metabase:
1. 使用了一个叫Clojure的语言来开发,这个语言对我们的研发团队来说很陌生,如果要二次开发估计学习成本太高了;
2. 只支持单表查询;
3. 没有对Impala的官方支持(这个就是硬伤了)。
最后,就是主角Redash了。先说优点:
1. 后端是Python,框架用了Flask + SQLAlchemy,都是很主流的东西,没毛病;
2. 更新迭代比较快,开发人员也比较活跃,经常在论坛上回答问题。
但是,缺点也不少:
1. 文档比较简陋;
2. 不支持界面国际化(目前只有英语,这个比较无语,据介绍会在将来解决,但没有明确的时间节点);
3. 网上能找到的经验总结不多,中文的尤其少,估计遇到坑的时候也会比较痛苦。
以后就是选型过程中主要着眼的地方,最后结合团队的实际情况,选择了Redash。后面将不定期对实际使用过程中的心得体会总结在Redash初学者笔记这个系列里,谢谢关注。
网友评论