工作中要做数据仓库的整理加工,会碰到一些不同的数据类型,需要不同的处理方式。今天来讲讲两种不同类型的数据,一种是可以累加的数据,另一种是不可以累加的数据。
时点数 VS 区间累计数
时点数的典型例子是:期末余额,比如你银行存款的期末余额是12月31日这一天你银行存款的金额,它是一个状态量,对时间而言是不可以累加的,好比你要计算年末的银行卡里面还有多少钱,你是不能把12个月每个月的余额加起来计算的。
还有一个典型的例子是库存,一个超市的仓库里面有多少货品,到月底年底总要进行盘点以了解业务的进展情况,要知道年底的库存量,你也是不能把每个月的库存量进行累加的。
累计发生数是一个时段的发生数的合计,比如你这个月一共取了多少钱存了多少钱就是银行存款的累计发生数。又比如仓库里这个月进了多少货,卖了多少货,也是可以累加计算的。
对于资产负债表,反映的是某时点的财务状况,所以都是时点数。
利润表反映的是某个时间段的经营和盈利状况,都是累计发生数。
最常见有效的方法是将两者结合起来,定期比如每个月底做统计结余计算余额,同时记录固定期间内的发生情况,即流入流出的数量,也就是下面的公式:
期初+ (流入 - 流出) = 期末;
应用到财务上就是
期初余额 + 借项金额- 贷项金额 = 期末余额
应用到库存上就是
期初数量 + 入库数量 - 出库数量 = 期末数量。
在做数据仓库的设计处理时,通常会采用两个模型,一个定期计算余额,比如每个月底的余额,第二个则计算一个小期间内的发生额,比如一个月内的发生额,让后将两者结合起来,进行加或者减。比如要计算3月15日的库存数量,可以用3月初(2月底)的库存数量加上3月1日到15日之间的进出库存数。
网友评论