美文网首页Python文集程序员面向机器学习的特征工程 | ApacheCN
面向机器学习的特征工程 六、降维:用 PCA 压缩数据集

面向机器学习的特征工程 六、降维:用 PCA 压缩数据集

作者: 布客飞龙 | 来源:发表于2018-06-21 13:39 被阅读40次

来源:ApacheCN《面向机器学习的特征工程》翻译项目

译者:@cn-Wziv

校对:@HeYun

通过自动数据收集和特征生成技术,可以快速获得大量特征,但并非所有这些都有用。在第 3 章
第 4 章中,我们讨论了基于频率的滤波和特征缩放修剪无信息的特征。现在我们来仔细讨论一下使用主成分分析(PCA)进行数据降维。

本章标志着进入基于模型的特征工程技术。在这之前,大多数技术可以在不参考数据的情况下定义。对于实例中,基于频率的过滤可能会说“删除所有小于n的计数“,这个程序可以在没有进一步输入的情况下进行数据本身。 另一方面,基于模型的技术则需要来自数据的信息。例如,PCA 是围绕数据的主轴定义的。 在之前的技术中,数据,功能和模型之间从来没有明确的界限。从这一点前进,差异变得越来越模糊。这正是目前关于特征学习研究的兴奋之处。

阅读全文

相关文章

  • 面向机器学习的特征工程 六、降维:用 PCA 压缩数据集

    来源:ApacheCN《面向机器学习的特征工程》翻译项目 译者:@cn-Wziv 校对:@HeYun 通过自动数据...

  • PCA降维

    当数据特征较多时,基本有两种方法:1 PCA降维2 Feature Selection(特征选择) PCA降维 <...

  • PCA算法推导

    一、PCA降维 1.PCA简介 PCA(主成分分析)是一种数据降维的方法,即用较少特征地数据表达较多特征地数据(数...

  • SKlearn - PCA数据降维

    PCA是无监督数据降维方式,目的是将一个高维数据集转换为一个低维数据集。如今我们的数据集往往有成百上千维的特征,但...

  • 基于sklearn的主成分分析

    理论部分 特征降维 特征降维是无监督学习的一种应用:将n维的数据降维为m维的数据(n>m)。可应用于数据压缩等领域...

  • 哲哲的ML笔记(二十九:降维)

    什么是降维 降维是一种无监督学习问题,通过数据压缩,能加快我们的学习算法。如果我们收集的数据集,有许多特征时,会需...

  • 5 主成分分析PCA

    主成分分析(PCA)是最常见的降维算法。 PCA是非监督的机器学习算法 主要用于数据的降维 其他应用:可视化、去噪...

  • PCA 笔记

    2020-05-21特征降维中PCA和LDA[bilibili-video]《Python机器学习》读书笔记(五)...

  • 无监督学习 - 降维 - PCA

    主成分分析 - PCA PCA是最常用的一种降维方法,通常用于高维数据集的探索与可视化,还可以用作数据压缩和预处理...

  • 预处理:主成分分析与白化

    UFLDL Tutorial学习笔记 PCA 主成分分析(PCA)是一种能够极大提升无监督特征学习速度的数据降维算...

网友评论

    本文标题:面向机器学习的特征工程 六、降维:用 PCA 压缩数据集

    本文链接:https://www.haomeiwen.com/subject/nmvqyftx.html