背书
随着大数据的到来,经常听到相关的词汇,维度、指标、BI、PV、UV等等,今天整理了这些词汇。
DW
DW是Data Warehouse的缩写,即数据仓库。
DW要区别于普通数据库,数据仓库用于支持决策,面向分析型数据处理;而普通数据库主要服务于软件/网站,对于一致性/事物要求较高。
BI
BI是Business Intelligence的英文缩写,中文解释为商务智能,用来帮助企业更好地利用数据提高决策质量的技术集合,是从大量的数据中钻取信息与知识的过程。简单讲就是业务、数据、数据价值应用的过程。用图解的方式可以理解为下图:
数据 业务 过程关系图
指标
我的理解就是结果数字,比如pv、uv等,和维度对应
维度
我的理解维度就是指标的定语。比如:“2015-01-12的pv是1000”,那么日期(是2015-01-12的抽象)是维度,pv是指标,1000是值
纬度表
维度表放的就是存放维度的数据表,或者维度关系的数据表
事实表
事实表里存放着要查询维度的数据。比如:每天的pv、uv
ETL
是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过萃取(extract)、转置(transform)、加载(load)至目的端的过程。ETL是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
OLAP
OLAP是联机分析处理(On-Line Analytical Processing)的缩写。
百度解释:OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。
翻译成人话:把事实表和维度表里面的数据展示出来的过程。
关于数据仓库分层的概念,可以参考:http://www.cnblogs.com/liqiu/p/4013743.html
网友评论