依据的理论:多为立方体分析
在多维立方体之前要先理解维度(Dimeension)和指标(Measure)
维度是观察数据的角度,是比较离散的值。比如日期,性别,地区,学校,不可做聚合运算(加减乘除)。指标是可以按照相同的维度计算的,比如,成绩,年龄,GDP等。
那么在SQL中如何区分维度和指标呢?有一个巧妙的方法,那就是group by后面的字段都是维度,在select到from之间即包含指标也包含维度。
维度和指标在明白何为指标,何为维度之后,我们看下cube和cuboid:给定一个数据模型,对于所有维度进行组合,举个例子,假如一个数据模型有4个维度,所有的组合可能性达到2的4次方个维度,也就是16个可能性。对于每一种可能的维度再针对于指标做聚合运算。然后把这16种运算结果物化视图,那么对应的16个物化视图就成为cuboid,所有的cuboid加起来被称为cube.
原理图工作过程:
1.制定好维度指标
2.预计算cube计算所有的cuboid保存为物化视图
3.执行查询操作,读取cuboid.
网友评论