美文网首页数据仓库
第四章 数据仓库中的粒度

第四章 数据仓库中的粒度

作者: 晨磊的微博 | 来源:发表于2018-12-17 15:45 被阅读14次

    [TOC]

    第四章 数据仓库中的粒度

    4.0 概述

    • 粒度的确定是数仓设计者和开发者所面对的重要问题

    4.1 粗略估算(数仓大小)

    • 建立数仓之初是对数据量级的估计
    • 估计方法(对已知表)
    步骤 说明
    1 计算一行所占字节 最大值,最小值
    2 1 年内的行数 最大值,最小值
    3 5 年内的行数 最大值,最小值
    4 表内关键字的大小 索引使用
    5 行 x 行数 一年内的空间
    6 重复其他表

    4.2 规划过程的输入

    一句话,上面的估计就是数仓最初的输入量,知道数量级就行了

    4.3 溢出存储器中的数据

    一句话,把不经常使用的低粒度数据归档,并提供归档数据的再访问

    4.4 确定粒度级别

    一句话,通过合理推测、和对需求进行预测确定仓库中留的数据粒度

    4.5 一些反馈循环技巧

    • 在知道需求的一半时,就可以尽快建立与DSS分析员的反馈循环了

    4.6 确定粒度级别的几个例子

    自己看吧

    4.7 填充数据集市

    一句话,仓库中的粒度至少是所有集市中的最小粒度

    4.8 小结

    太废话了

    相关文章

      网友评论

        本文标题:第四章 数据仓库中的粒度

        本文链接:https://www.haomeiwen.com/subject/ldkckqtx.html