美文网首页
用户行为数仓搭建

用户行为数仓搭建

作者: etheon | 来源:发表于2020-02-19 19:53 被阅读0次

# 数仓分层概念

1.数仓分层

ods

存放原始数据

dwd

数据清洗

dws

数据汇总

ads

为统计报表提供数据

2.分层优点

复杂问题简单化

减少重复开发

隔离原始数据

3.数仓命名规范

层表前缀ods,dwd,dws,ads

维度表前缀dim

全量表df

增量表di

# 数仓分层配置

1.建立业务流程

2.新建主题

3.层级管理

# 原始数据层ods

1.建表语句

2.配置基本属性

3.配置物理模型

# datahub推送数据到maxcompute

1.创建dataconnector

2.发送数据

3.接收数据

# dwd层日志格式分析

1.日志格式分析

2.自定义udtf

3.dwd层建表

4.手动导入dwd层

5.数据导入脚本

相关文章

  • 用户行为数仓搭建

    # 数仓分层概念 1.数仓分层 ods 存放原始数据 dwd 数据清洗 dws 数据汇总 ads 为统计报表提供数...

  • 项目需求分析

    1.采集埋点日志数据 2.采集业务数据库中的数据 3.数据仓库的搭建(用户行为数仓,业务数仓) 4.分析统计业务指...

  • 数仓入门基础-6-数仓建模

    个人博客:https://renwula.github.io/,本系列基于互联网公司数仓,使用hive搭建数仓 ...

  • 数仓实战03:数仓搭建-ODS 层

    1.创建数据库 1)启动hive[atguigu@hadoop102 hive]$ nohup bin/hive ...

  • 数仓实战04:数仓搭建-DWD层

    1)对用户行为数据解析2)对核心数据进行判空过滤。3)对业务数据采用维度模型重新建模,即维度退化。 1.用户行为启...

  • 数仓实战05:数仓搭建-DWS层

    1.业务术语 1)用户用户以设备为判断标准,在移动统计中,每个独立设备认为是一个独立用户。Android 系统根据...

  • 数仓实战06:数仓搭建-DWT层

    1.设备主题宽表 1)建表语句 2)数据装载 3)查询加载结果hive (gmall)> select * fro...

  • 数仓实战07:数仓搭建-ADS层

    1.设备主题 1.1 活跃设备数(日、周、月)需求定义:日活:当日活跃的设备数周活:当周活跃的设备数月活:当月活跃...

  • 数仓初探

    ’## 数仓特征: 面前主题:数据分析问题,一个主题对应一个分析领域,如:用户行为 集成:面向企业级的数据,数据具...

  • Kafka Connect For MySQL 实现增量数据同步

    前言 最近公司需要搭建基于 Flink 框架的实时数仓,为了保证数仓的稳定性,决定引用消息中间件 Kafka 。K...

网友评论

      本文标题:用户行为数仓搭建

      本文链接:https://www.haomeiwen.com/subject/zidpfhtx.html