美文网首页
kylin的工作原理之度量和指标

kylin的工作原理之度量和指标

作者: 起个什么呢称呢 | 来源:发表于2018-06-29 11:08 被阅读289次

    依据的理论:多为立方体分析


    在多维立方体之前要先理解维度(Dimeension)和指标(Measure)

    维度是观察数据的角度,是比较离散的值。比如日期,性别,地区,学校,不可做聚合运算(加减乘除)。指标是可以按照相同的维度计算的,比如,成绩,年龄,GDP等。

    那么在SQL中如何区分维度和指标呢?有一个巧妙的方法,那就是group by后面的字段都是维度,在select到from之间即包含指标也包含维度。

    维度和指标

    在明白何为指标,何为维度之后,我们看下cube和cuboid:给定一个数据模型,对于所有维度进行组合,举个例子,假如一个数据模型有4个维度,所有的组合可能性达到2的4次方个维度,也就是16个可能性。对于每一种可能的维度再针对于指标做聚合运算。然后把这16种运算结果物化视图,那么对应的16个物化视图就成为cuboid,所有的cuboid加起来被称为cube.

    原理图

    工作过程:

    1.制定好维度指标

    2.预计算cube计算所有的cuboid保存为物化视图

    3.执行查询操作,读取cuboid.

    相关文章

      网友评论

          本文标题:kylin的工作原理之度量和指标

          本文链接:https://www.haomeiwen.com/subject/bhwoyftx.html