背景
影响达成目标的因素存在很多种,利用数据定量确定各因素Xi对目标或Y值影响效果,从而达到数据驱动运营的效果。
其中,要确定因素Xi的权重。权重必须符合所有因素的权重累积和为1,即归一化。
下面,以“提升商品详情页”UV为例,按分析步骤应用主成分分析法。
注:本文所有数据为编造的虚假数据,仅为数据分析所用,不具有任何应用价值。
目标
- 提升商品详情页UV
- 为商品展示提供依据
- 提升商品销量
- 增加商城平台收益
应用价值
通过定量分析,确定各因素所占权重。得出影响因素的公式,可以确定出商品详情页受欢迎程度,为商品推荐、提升商品销量、首页商品位置设计提供动态的公式依据。
工具
- IBM SPSS Statistics 23(主要用于做因子分析)
- Excel(对SPSS分析结果进行整理,输出归一化因素权重)
原理
一般情况下,由于影响某目标的因素存在N多个,这些因素变构成N维空间数据。在这种情况下,这N维数据往往有具有一定的相关性,我们要确定这N维数据对目标的影响权重是非常困难的。然而,主成分分析方法提供给我们一种降维的思想,通过将N维因子进行正交变换,随即形成彼此之间相互独立的k维(k<N)数据,这种方法大大降低了分析的维度。并且,通过分析得出“主成分”,利用“主成分”确定影响权重,就变得简单可行。
思路
利用主成分分析方法确定多因素影响权重的大致思路如下所示:
- 利用SPSS进行因子分析
- 输出结果分析
- 确定权重
下面,详细介绍各步骤:
1. 利用SPSS进行因子分析
将数据导入或录入到SPSS数据视图中,并在变量视图中更改变量名称、类型、宽度、小数位数等参数。
image.png image.png
点击工具栏中“分析” -> “降维” -> “因子分析”,呈现出因子分析框。
image.png将需要分析的因子加入至变量框中。
image.png并针对各统计框进行设置:
描述
image.png
提取
image.png
旋转
image.png
得分
image.png
2. 输出结果分析
按照上述步骤进行操作,输出因子分析结果。
Inked1499072828(1)_LI.jpg根据上表“总方差解释”可以看出,前第三个成分的初始特征值均大于1,并且累计%已高达98.608,大于80%。因此,可以用前三个成分来代替原来的六个指标因素(UV、PV、销售额、销量、加入购物车数量、收藏数量)。这样,变降低了分析的维度。
image.png从表总可以看出,第1,2,3主成分对于原指标的载荷数。例如,主成分1对于UV的载荷数为0.797。
3. 确定权重
下面利用Excel编辑公式,确定各因素的权重。
将“总方差解释”和“成分矩阵”两张表复制到Excel中,以备数据分析使用。
(1)确定主成分在各线性组合中的系数
利用表格“成分矩阵”中载荷数除以表格“总方差解释”中“总计值”开平方。
例如:成分1在UV中的系数为:0.797/SQRT(2.913)
结果如下图所示:
(2)确定各因素在综合得分模型中的系数
对步骤(1)中所得的各指标所拥有的三个主成分进行加权平均,注意利用的是初始特征值的方差百分比。
例如:指标UV在综合得分模型中的系数为
(0.46748.55%+0.32632.443%-0.37*17.641%)/(48.55%+32.443%+17.641%)=0.271
(3)确定各因素的权重系数
即,将各因素在综合得分模型中的系数进行归一化。
例如:指标UV的权重系数为
0.271/SUM(0.217+0.153+…+0.111)=0.202
最终,我们得到在这6项因素中,各因素所占的权重值。
网友评论