我们看故事的时候知道故事分为喜剧、悲剧、武侠等等很多种类,那数据分析也是一样的。在特定的分析场景里,我们所关注的重点也不同,知道我们重点应该分析哪些方面。在某种程度上,数字不再仅仅是出现在侧栏的表格,而是能够在真正意义上促进故事的发展。
一、随时间变化
数据里应该要包含“日期”这个字段,那么对于这样一份数据,我们可以从哪些方面进行分析呢?
1、某一个指标、数据在日期维度上是如何变化的,寻找趋势。
2、某一个指标在日期维度上的最大值、最小值;拐点、异常值
3、从时间的不同角度分析,全段时间、年度、季度、月份的表现,可以看出是否存在季节性规律。
4、从一天的早到晚(24h)不同时间段某指标的变化,可以探寻差异
二、放大/缩小分析区域
1、集中关注某一特定区域或范围(可以是时间范围,也可以是地区范围或者其他)的数据,并将其于其余的数据作对比。
2、从某些有特征的数据点入手,分析该特征是否存在共性(比如周期性、季节性、地域性等的规律)
注:放大/缩小分析方法在地理分析中对比不同区域时显得尤为强大
三、对比
1、通常是将一个组别/维度/项目与另外一个作对比,展示不同类别/区域为什会呈现出不同的现象。
2、对比大概有两种形式,一种是同一层级间的个体VS个体,另一种是个体VS整体(平均数/中位数)
四、向上钻取/向下钻取
做钻取分析需要数据里包含具有层级结构的字段,比如“产品类别->产品子类别->产品名称“或者“国家->省->市”或者“年->季度->月->日“这类的层级结构。
1、总览全局后需要关注某些具体的细节,选择整体向下钻取,得到更为详细的信息。
2、探寻某一维度是如何影响全局的,通过向上钻取,可以得到全局信息。
五、突出值/异常值
表现异常的时间段/数据点,我们称之为突出值或异常值。
突出值一般通过散点图和箱线图来呈现。而且异常值越突出,给我们的印象会越深。
1、用不同的颜色或者注释highlight出异常值,达到突出的目的。
2、挖掘出突出值背后的故事,是数据错误还是其他情况。
六、探究交叉点
交叉点,是指多条趋势线交叉或者某个指标超过另外一个指标的时间点。通常代表某种转折或者某个标志性的时间。
七、剖析原因
1、在关注某一指标时,分析哪些因素会影响到该指标到表现。
2、如上图的“交易量数值变化”和“交易量百分比变化”,可从不同角度分析该指标,如同比、环比、占总额百分比。
网友评论