企业开展数据化运营,需要指标来驱动业务,但企业内部指标间纷繁复杂,如何拨开云雾,统一指标口径,将指标管理得井井有条...[作者空间]
元数据定义 按照传统的定义,元数据(Metadata)是关于数据的数据。元数据打通了源数据、数据仓库、数据应用。记...[作者空间]
事实表基础 事实表特性 事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计,通过获取描述业务过程的度量来表...[作者空间]
维度的基本概念 维度是维度建模的基础和灵魂。在维度建模中,将度量称为“事实”将环境描述为“维度”,维度是用于分析事...[作者空间]
传统的数据仓库一般是搭建在关系型数据库上,数据建模大多基于ER模型;现代互联网公司一般是搭建在大数据环境(cdh、...[作者空间]
分布式SQL查询引擎方面,了解到的有Hive、SparkSQL、Presto、Flink,可以说各有侧重,今天说一...[作者空间]
Presto是一个开源的,基于内存的分布式实时计算框架,它出自Facebook,国内大厂现在已有很多应用案例,如:...[作者空间]
现状 公司属于是互联网金融行业,但因为只是中小型企业,技术积累较少,数据部门也是16年未开始组建的。最初只是一个提...[作者空间]