美文网首页
主成分分析(Principal Component Analys

主成分分析(Principal Component Analys

作者: lilicat | 来源:发表于2019-01-24 19:57 被阅读0次

重点

1 作用

2 算法过程


作用

1 Feature之间不是相互独立,存在相关性,造成特征冗余。增加计算量。PCA可以改善这一情况

2 高维度数据可视化


算法过程

步骤

有一个矩阵X,维度(m,n),m个采样数据,每个数据有n个feature。

1 特征去均值,标准化(归一化)

X_{new} = X*V

    (1) 求X^TXCov(X^T)的特征值(ew)和特征向量(ev),其中维度:ew(1,n),ev(n,n)

  (2) X_{new} = X*ev,维度:X_{new}(m,n)

  (3)按照ew从大到小的顺序,取ev的对应的列。ev取前k列得到矩阵V ,维度(n,k)

            k的取值标准是,要求将\sqrt{ew} 后,前k个元素累加和comsum > 95%总和。

    (4) X_{new} = X*V,维度:X_{new} (m,k)

kev即主成分(主方向)。这样,就实现了从nk维的降维。

注意!!!

必须对数据进行预处理,去均值化,标准化。


相关文章

网友评论

      本文标题:主成分分析(Principal Component Analys

      本文链接:https://www.haomeiwen.com/subject/rjuyjqtx.html