降维PCA

降维PCA

作者: 阿发贝塔伽马 | 来源:发表于2017-09-24 19:58 被阅读58次

PCA
【R图千言】主成分分析之3D绘图
numpy实现鸢尾花数据集PCA降维
PCA降维
使用标准化对数据进行处理
在线作图|2分钟绘制三维PCA图
PCA算法推导
2018-07-12课程笔记(2):DIMENTION REDU
PCA
(四) 03_PCA降维和heatmap热图

如有一组数组数据m个n维列向量Anxm

想要降维，随意丢弃数据显然不可取，降维可以降低程序计算复杂度，代价是丢弃了原始数据一些信息，那么降维的同时，又保留数据最多信息呢。

我们希望投影后投影值尽可能分散（不然数据都堆积到一起了），而这种分散程度，可以用数学上的方差来表述。此处，一个字段的方差可以看做是每个元素与字段均值的差的平方和的均值，即：

假设Anxm已经是每行元素减去均值，那么每行均值为0（这么操作可以带来很大的方便,等于对数据做了平移操作），每行方差为

协方差

上图，在n维空间中u是Anxm一个列向量，投影到低维空间中，e是低维空间一个基向量，||e||=1,需要确定e的方向，使得A的列向量投影到e的点方差最大，也就是很分散，向量u投影到e的坐标是它们的内积<e,u>,先算平均值

方差就简单多了

这是个二次型，求最大方差转化为求该二次型最大值
由对称矩阵性质，对称矩阵AA^T的特征向量构成n维空间一组标准正交基，用矩阵p表示，则向量e可以被p线性表示

方差

注意此处

最大时

取的是AA^T最大特征值特征向量方向

只要取P的前r个特征值的特征向量，就可以把Anxm降到Arxm.

举个例子矩阵A

五个二维点降到一维，不论投影到x轴还是y轴，都有点重合。

使用上面方法操作一遍

求特征值

解得

得到特征向量

标准化特征向量

矩阵P

验证

对矩阵A做变换到一维

PCA方法的缺点

PCA作为经典方法在模式识别领域已经有了广泛的应用，但是也存在不可避免的缺点，总结如下：
(1) PCA是一个线性降维方法，对于非线性问题，PCA则无法发挥其作用；
(2) PCA需要选择主元个数，但是没有一个很好的界定准则来确定最佳主元个数；
(3) 多数情况下，难以解释PCA所保持的主元分量的意义；
(4) PCA将所有的样本作为一个整体对待，去寻找一个均方误差最小意义下的最优线性映射，而忽略了类别属性，而它所忽略的投影方向有可能刚好包含了重要的可分类信息，如下图所示，红色和蓝色的点为原数据，中间绿色的点为重构后的数据，由此可看出，这种情形下，主元方向不能保持数据的聚类信息(使用LDA)。

相关文章

PCA
PCA降维一、算法原理降维算法还原算法二、算法实现三、scikit-learn PCA 四、PCA降噪 ...
【R图千言】主成分分析之3D绘图
主成分分析 (PCA, principal component analysis)是一种数学降维方法。 PCA降维...
numpy实现鸢尾花数据集PCA降维
PCA降维过程在前面的一篇博客中我已经从数学角度解释了PCA降维的原理，我们从中也可以得到PCA降维的过程1）将...
PCA降维
当数据特征较多时，基本有两种方法：1 PCA降维2 Feature Selection(特征选择) PCA降维 <...
使用标准化对数据进行处理
标准化 PCA降维
在线作图|2分钟绘制三维PCA图
三维PCA 主成分分析算法（PCA）是最常用的线性降维方法。PCA降维为了在尽量保证“信息量不丢失”的情况下，对原...
PCA算法推导
一、PCA降维 1.PCA简介 PCA（主成分分析）是一种数据降维的方法，即用较少特征地数据表达较多特征地数据（数...
2018-07-12课程笔记(2):DIMENTION REDU
【关键词：数据降维，PCA】 PCA(Principal Components Analytics)重要数据的定位...
PCA
什么是PCA PCA是目前最为流行的的降维算法举个例子，把下图二维数据降维成一维数据。我们可以找出更低维度的空间...
(四) 03_PCA降维和heatmap热图
PCA降维——第一步，将exp数据转置，降维为甚需转置呢？第二步，PCA降维 dim1和dim2分别代表什么？ ...

网友评论

小翔扁小丁:您好，刚刚拜读完文章，自己也想写点东西，不知道这些图和公式是怎么弄得，能教下我吗？
小翔扁小丁:@14142135623731 嗯，谢谢😀
阿发贝塔伽马:@小翔扁小丁回去发个链接给你
阿发贝塔伽马:@小翔扁小丁公式是用tex打得

本文标题：降维PCA

本文链接：https://www.haomeiwen.com/subject/njzkextx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

Python machine learning-sklearning

机器学习与数据挖掘

深度学习·神经网络·计算机视觉

Python语言与信息数据获取和机器学习

热点阅读

Python machine learning-sklearning

机器学习与数据挖掘

深度学习·神经网络·计算机视觉

Python语言与信息数据获取和机器学习

机器学习

关于我们|服务条款|联系我们|降维PCA|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！