美文网首页大数据精进之路
说说数仓(5)-最重要的维度之日期维度

说说数仓(5)-最重要的维度之日期维度

作者: 橘猫吃不胖 | 来源:发表于2019-01-11 12:20 被阅读35次

日期维度是我们最常用的维度,平台初始,最先初始化的可能就是日期维度,这里我们就简单介绍下日期维度。

什么是日期维度

我们日常生活,数据的产生都和日期有关,每一分、每一秒都会产生数据,数据分析也离不开日期。
日期维度就是一张固化的日历,一年365天,每一天都有,我们打开电脑中的日历:

日历

这里面有的,我们都可以固化下来,像周几、农历、年、月、日、节假日,我们都可以固化下来,方面我们分析的时候使用。

日期维度的结构

日期维度可以尽可能多的包含日期详细信息,这样在分析的时候可以直接使用,还要结合公司的一些特殊情况,像一些特殊展示的日期格式。

  • 基本的年季度月周日信息


    基本信息
  • 拓展信息
    除了上面的基本的日期,平时用的还有有些拓展信息


    拓展信息

可能还有些农历信息、农历年份等,公司自定义周的开始日期、结束日期等,和日期相关的所有内容都可以加进来进行维护。

维度初始化

数据初始化,我们可以使用Java、Python或者SQL,通过常用的日期函数基本可以满足我们的数据需求,用SQL初始化,需要使用有循环控制语句的,如:MySQL、PG都行,Hive的话要结合Shell或者Python来使用。

一般不需要初始化太多年的数据,只要覆盖公司业务数据就好了,还有节假日信息每年都需要结合国务院发布的信息就行维护。

关于小时

平时我们还会分析小时数据,一般不会把他放在日期表中,而是会单独放在一张小时维度表里,需要的时候一起使用就行了。

相关文章

  • 说说数仓(5)-最重要的维度之日期维度

    日期维度是我们最常用的维度,平台初始,最先初始化的可能就是日期维度,这里我们就简单介绍下日期维度。 什么是日期维度...

  • 从0开始研究数据仓库的一些想法

    研究方向 数仓理论:分层设计理论、维度建模理论基于OLAP数仓:adb/clickhouse/greenplum/...

  • 数仓建模 - 维度 vs 关系

    数据仓库模型建设 模型概念 维度建模 关系建模 建模实现对比 模型选择 Data Vault 简介 数据仓库模型建...

  • 传统数据仓库在大数据平台上的进化

    模型的进化 一、传统数仓的3NF模型&维度模型 数据仓库建模中维度建模和3NF建模并不是OR的关系,它们更像是上下...

  • 数仓建模—宽表的设计

    宽表的设计 其实宽表是数仓里面非常重要的一块,前面我们介绍过了维度表事实表,今天我们介绍一下宽表,前面我们说过了数...

  • 今日学习思路(1.12)

    一、关于数仓的理解: 数仓就是从基础数据里拆出一组数据进行单独的管理,所有跟统计相关的内容都从这个维度去取,效率高...

  • 构建并生成日期维度数据表

    基于 MySQL 生成日期维度数据创建日期维度数据表DROP TABLE IF EXISTS `date_dim`...

  • 业务数据分析方法论

    一、日常取数 3步方法论处理数据需求: 01 确认数据范围 比如时间维度、渠道维度、客户维度、区域维度等 02 确...

  • HAWQ取代传统数仓实践

    1.为什么选择HAWQ 2.HAWQ技术解析(二) —— 安装部署 HAWQ取代传统数仓实践(十一)——维度表技术...

  • 维度关系论

    维度,又称维数,是指数学中独立参数的数目,简单的说,就是指空间维度坐标,不同维度需用不同的坐标来表示。谈到维度...

网友评论

    本文标题:说说数仓(5)-最重要的维度之日期维度

    本文链接:https://www.haomeiwen.com/subject/tdqbiftx.html