美文网首页机器学习
08 特征工程 - 特征降维 - LDA

08 特征工程 - 特征降维 - LDA

作者: 白尔摩斯 | 来源:发表于2019-01-04 10:22 被阅读87次

线性判断分析(LDA): LDA是一种基于分类模型进行特征属性合并的操作,是一种有监督的降维方法。

LDA原理

LDA的全称是Linear Discriminant Analysis(线性判别分析),是一种有监督学习算法。

LDA的原理是,将带上标签的数据(点),通过投影的方法,投影到维度更低的空间中,使得投影后的点,会形成按类别区分,一簇一簇的情况,相同类别的点,将会在投影后的空间中更接近。用一句话概括就是:“投影后类内方差最小,类间方差最大”

下图中,左边的映射效果还不是很好,甚至有些分类还重合到了一起。右边的映射效果很好,达到了类内数据方差小,类与类之间方差大。

下图中的柱状图 表示有多少点落在了这一区间内。柱越高,说明这部分的数据越稠密。显然右边的方差会小于左边的方差。


如何求解LDA问题

假定转换为w,那么线性转换函数为x’= wTx; 并且转换后的数据是一维的。

考虑二元分类的情况,认为转换后的值大于某个阈值,属于某个类别,小于等于某个阈值,属于另外一个类别,使用类别样本的中心点来表示类别信息,那么这个时候其实就相当于让这两个中心的距离最远:

μj 表示原本数据的中心点。
μ‘j 表示原始数据经过坐标轴转换之后,新数据的中心点。

同时又要求划分之后同个类别中的样本数据尽可能的接近,也就是同类别的投影点的协方差要尽可能的小。

结合着两者,那么我们最终的目标函数就是:

对目标函数进行转换(A、B为方阵,A为正定矩阵):

该式子和PCA降维中的优化函数一模一样,所以直接对中间的矩阵进行矩阵分解即可。


PCA和LDA

相同点:
1、 两者均可以对数据完成降维操作。
2、 两者在降维时候均使用矩阵分解的思想。
3、 两者都假设数据符合高斯分布。

不同点:
1、 LDA是监督降维算法,PCA是无监督降维算法。
2、 LDA降维最多降到类别数目k-1的维数,而PCA没有限制。
3、 LDA除了降维外,还可以应用于分类。
4、 LDA选择的是分类性能最好的投影,而PCA选择样本点投影具有最大方差的方向。

相关文章

  • 08 特征工程 - 特征降维 - LDA

    线性判断分析(LDA): LDA是一种基于分类模型进行特征属性合并的操作,是一种有监督的降维方法。 LDA原理 L...

  • 三种常用降维方法的思想总结

    一.判别分析降维 LDA降维和PCA的不同是LDA是有监督的降维,其原理是将特征映射到低维上,原始数据的类别也...

  • 09 特征工程 - 总结

    08 特征工程 - 特征降维 - IDA 数据清洗常见流程 异常数据处理 案例 - 车辆数据预处理 每个样本具有7...

  • 特征预处理之特征降维(LDA)

    一、概念 LDA:Linear Discriminant Analysis 线性判别式分析 (NOT:在文本分析领...

  • PCA 笔记

    2020-05-21特征降维中PCA和LDA[bilibili-video]《Python机器学习》读书笔记(五)...

  • 07 特征工程 - 特征降维 - PCA

    06 特征工程 - 特征选择 特征降维必须在特征选择做完以后才能进行。 当特征选择完成后,可以直接可以进行训练模型...

  • 机器学习 —「特征工程」方法论

    什么是特征工程? 数据预处理 特征选择 降维 1. 什么是特征工程? 有这么一句话在业界广泛流传,数据和特征决定了...

  • 2019-02-27

    内容为西瓜书的第10章特征选择和第11章特征降维。 1 在机器学习工程中,特征工程才是最重要,特征决定着算法的上限...

  • 特征工程之降维

    机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中。维数约减或降维(Dim...

  • 3.0 特征工程--降维

网友评论

    本文标题:08 特征工程 - 特征降维 - LDA

    本文链接:https://www.haomeiwen.com/subject/avchrqtx.html