1.PCA

作者: Persistently | 来源:发表于2017-04-25 16:25 被阅读0次

先上例子:

代码 生成结果

图1根本看不出是什么分布,将图一的数据进行PCA分析,可以得到图二所示:
PCA过程:
1.特征值分解
2.选择特征值较大的k个所对应的特征向量
3.将原数据减去均值(mXn),协方差为(nXn), 选取的k个特征向量组成的矩阵为EigenVectors(n*k)。那么投影后的数据FinalData为
FinalData(mXk) = DataAdjust(mXn矩阵) x 特征向量(nXk)
但是,还是会丢失一些信息~

PCA的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。

PCA解释

左边的图L1与L2范围太接近了,不适合降维;如果将坐标轴旋转到右边图所示,那么L1与L2的值相差较大就适合降维。椭圆的长短轴相差得越大,降维也越有道理。
这样的过程就相当于寻找一个旋转矩阵,经过推导,这个旋转矩阵是与特征值有关。
具体推导看reference。

值得注意的是:
PCA是一个无标签的分类,他不考虑数据是否有标签,这样会导致原本可以分开的数据做了PCA后就分不开了。这时候可以用LDA( Linear Discriminant Analysis)

reference:
http://blog.jobbole.com/109015/

相关文章

  • 1.PCA

    先上例子: 图1根本看不出是什么分布,将图一的数据进行PCA分析,可以得到图二所示:PCA过程:1.特征值分解2....

  • pca算法介绍及简单实例

    1.pca算法 主成分分析(Principal components analysis,PCA)是一种分析、简化数...

  • 无监督第一节:PCA 详细介绍及 kernal PCA ,pro

    1.PCA 主成分分析(Principal Component Analysis,PCA)是非常经典的降维算法,属...

  • 2020-08-25--PCA降维01

    主要内容 PCA简介 使用梯度上升法解决PCA问题 1.PCA简介 PCA(Principal Component...

  • EOF经验正交分解(PCA)

    EOF经验正交分解(PCA) 1.PCA与EOF的区别和联系 经验正交函数分析方法(empirical ortho...

  • PCA/热图

    PCA样本聚类图 1.PCA 图---- 2.top 1000 sd 热图---- 关于scale的进一步探索:z...

  • PCA 和火山图

    1.PCA 加载R包 计算PCA ggplot2绘图 整理数据 1.去掉行名 解释度 比如PC1解释度为8.224...

  • python学习笔记之PCA

    1.PCA算法简述 输入:n维样本集D=(x1,x2,...,xm),要降到的维数n‘。输出:降维后的样本集D'。...

  • PCA算法推导

    一、PCA降维 1.PCA简介 PCA(主成分分析)是一种数据降维的方法,即用较少特征地数据表达较多特征地数据(数...

  • 单组学的多变量分析|1.PCA和PLS-DA

    PCA和PLS-DA 我们使用SRBCT数据集来说明PCA和sPLS-DA。 安装并加载mixOmics包 示例数...

网友评论

      本文标题:1.PCA

      本文链接:https://www.haomeiwen.com/subject/hxpvzttx.html