PCA是unsupervised,也就是说不需要知道sample对应的label,而LDA是supervised,需要知道每一个数据点对应的label。
PCA是为了去除原始数据集中冗余的维度,让投影子空间的各个维度的方差尽可能大,也就是熵尽可能大。LDA是通过数据降维找到那些具有discriminative的维度,使得原始数据在这些维度上的投影,不同类别尽可能区分开来。
![](https://img.haomeiwen.com/i18072991/3c99339de05cb53e.jpeg)
![](https://img.haomeiwen.com/i18072991/75f99fdbf244f147.png)
图的左边是PCA方式,可以看出,数据最方便的映射到直线上,达到降维,但是不能分类
![](https://img.haomeiwen.com/i18072991/93537896b8638973.png)
PCA是unsupervised,也就是说不需要知道sample对应的label,而LDA是supervised,需要知道每一个数据点对应的label。
PCA是为了去除原始数据集中冗余的维度,让投影子空间的各个维度的方差尽可能大,也就是熵尽可能大。LDA是通过数据降维找到那些具有discriminative的维度,使得原始数据在这些维度上的投影,不同类别尽可能区分开来。
图的左边是PCA方式,可以看出,数据最方便的映射到直线上,达到降维,但是不能分类
本文标题:PCA &LDA比较
本文链接:https://www.haomeiwen.com/subject/wywmkctx.html
网友评论