一般来说,PCA分析2个图够了,以iris数据为例,在经过PCA分析后,我们可以得到第一章碎石图,表示PC1,2,3,4的特征向量值,可以据此选择保留的主成分(通常选择特征向量值超过2的变量),此图显示出1个主成分可以保留。
image.png此外,可以有另外2个基于特征向量值选择主成分的标准,即 Kaiser-Guttman 标准和 Broken Stick 标准,这些标准可以反应主成分对于解释原始数据的贡献程度
image.png依据Kaiser-Guttman 标准,仅应该保留主成分1,上图中仅PC1超过了平均值,下图中仅PC1超过了红色柱形图。
在选择了PC后,需要考虑变量对于PC的贡献,下图中,Petal Length,Width, Sepal Length对于PC1的贡献大,即方向偏向x轴方向;而Sepal width对PC2的贡献大,方向偏向y轴。长度越长,相对影响越大。
image.png
网友评论