对于之前只用过Excel的同学来说,数据建模是个高深的概念,因为Excel不能跨表分析,因此也就不存在表与表之间建立关系的问题。
而数据建模最重要的概念就是:关系。
进行复杂的数据分析时,几乎不存在单表的数据源(即使是一个大单表,也要想办法拆分为维度表和事实表),想要做好数据分析,必须先梳理并建立这些表之前的关系。
关系,就是一个表和另一个表通过某个字段(列)进行关联,比如产品表和订单表,都有个产品名称,那么就可以利用共同的产品名称,把这两个表连接起来,并且产品表中的每个产品名称一般是唯一的,而订单表中,每一个产品都会有数次销售,产品名称在订单表中不会是唯一的,所以产品表与订单表会建立一对多的关系。
除了一对多的关系,还有多对多的关系,做分析时这种情况也会经常遇到。
建立关系,以及数据建模不只是一个概念或者一个步骤,它是数据分析的基础,一个良好的数据模型,可以让之后的分析行云流水,并且需要更少代码更简洁的解决方案就可以完成。
我是采悟,“PowerBI星球”作者,微信:powerbi001,合作投稿事宜可以和我联系,powerbi星球会员也可以加我,我会邀请你进入会员专享微信群。
微信公众号"PowerBI星球",回复关键字"PowerBI",获取《七天入门PowerBI》电子书。
网友评论