数据仓库上下游表间数据质量检查产生于下游表生成过程中,也是下游表本身的数据质量控制问题,上下游的关系并不仅限于数据...[作者空间]
http://blog.csdn.net/u011239443/article/details/52623602《...[作者空间]
一、数据之路 二十一世纪是生物的世纪,这句话只要上过高中的小伙伴应该都知道,当初选择大学专业也是受其影响。大一、大...[作者空间]
做数据仓库的头两年,使用高配置单机 + MySQL的方式来实现所有的计算(包括数据的ETL,以及报表计算。没有OL...[作者空间]
更新:本文在2017年之后有微量更新(主要是数据倾斜一节),目前暂时只在我的独立blog(sunyi514.git...[作者空间]
想要数据粒度的合理性、模型的灵活性得到保证,并且能够适应未来的信息资源,需要遵守维度建模的一些原则。否则,很容易会...[作者空间]
在数据仓库中,无一例外地需要和时间维度打交道,因此设计合理的时间维度,也是一个数据仓库项目开始必备的资源储备,如果...[作者空间]
实时数据仓库相比较离线数仓,实时性更高,这就要求数据流尽量短,层次相对简化,相比较离线,这里的ods和明细表就可以...[作者空间]
作为IT从业者,今天看到这边篇文章,自己的想法还是挺多的,转载过来保存一下,方便自己后期阅读吧。 美团数据仓库,在...[作者空间]