什么是数据模型
数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。
数据仓库建模步骤
-
业务建模,划分业务,梳理业务,适用的建模方法:实体建模。demo:
划分业务:按照业务部门划分
划分业务主题:xx部门划分为:浏览器/金融/搜索等; -
领域概念建模,将业务建模抽象成实体,适用的建模方法:实体建模,将数据抽象成:实体-事件-说明。demo:
浏览器o2o打点,deviceid(实体1)-itemid(实体2)-expose(事件)-在20190910 13:44:59的推荐path场景下(说明) -
逻辑建模,实例化(实体的属性及实体之间的联系等),适用的建模方法:范式建模。demo:
内容池(item实体属性表),用户属性表,ods层o2o表 -
物理建模,就是落地。demo:
选择数据平台,如hive
创建生成表的脚本,定义字段,规范字段转化的代码等,如:thrift生成hive表
针对数据集市即(浏览器)的需要,按照维度建模的方法,生成一些事实表(o2o)和一些维表(暂无)
网友评论