主成分分析
主成分分析与因子分析探索简化多变量得常用方法。
主成分分析:principal component analysis,也简称为PCA,是一种数据降维技巧,能够将大量相关变量转化为一组很少的不相关变量,这些无关的变量称为主成分。主成分其实是对原始变量重新进行线性组合,将原先众多具有一定相关性的指标,重新组合称为一组新的相互独立的综合指标。
主成分分析公式 PC1=a1X1+a2X2+...+akXk
用3-5个主成分解释原有数据80%的变化,即可
举例,360行 分类为 3-5类
主成分分析与因子分析步骤
1. 数据预处理
2. 选择分析模型
3. 判断要选择的主成分/因子数目 碎石图来判断
4. 选择主成分/因子
5. 旋转主成分/因子
6. 解释结果
7. 计算主成分/因子得分。可选的
library(psych)
USJudgeRatings
dim(USJudgeRatings)
fa.parallel(USJudgeRatings,fa="pc",n.iter = 100) #绘制碎石图
pc <- principal(USJudgeRatings,nfactors = 1,rotate = "none",scores = F)
#nfactor 表示主成分数目 score 主成分得分 rotate 主成分旋转方式
# pc scores设置为T,可以获得每个变量的得分
#PC1包含成分载荷,观测变量与主成分的相关系数
#h2成分公因子的方差,主成分对每个变量的方差解释度
#u2指主成分唯一性,方差无法被主成分解释的比例
#ssloading 包含与主成分相关联的特征值,指的是特定主成分相关联的标准化后的方差值。
# proportion Var 是每个主成分对数据集的解释程度
Harman23.cor
fa.parallel(Harman23.cor$cov,n.obs = 305,fa = "pc",n.iter = 100,show.legend = F)
pc <- principal(Harman23.cor$cov,nfactors = 2,rotate = "none")
pc
网友评论