深度挖掘学习之基于特征选择的降维方法

作者: 皮皮杂谈 | 来源:发表于2019-06-09 01:07 被阅读7次

深度挖掘学习之基于特征选择的降维方法
面试题目总结-机器学习算法-基础
PCA降维
sklearn学习 — 数据降维
降维与特征选择
《机器学习》第11章特征选择
人脸识别基本原理
数据降维之特征选择
特征选择
一起来读西瓜书：第十一章特征选择与稀疏学习

在对海量数据或大数据进行数据挖掘时，通常会面临“维度灾难”，原因是数据集的维度可以不断增加直至无穷多，但计算机的处理能力和速度却是有限的；另外，数据集的大量维度之间可能存在共线性的关系，这会直接导致学习模型的健壮性不够，甚至很多时候算法结果会失败。因此，我们需要降低维度数量并降低维度间共线性的影响。

数据降维也被称为数据规约或数据约减，其目的是减少参与数据计算和建模维度的数量。一种典型的数据降维思路是基于特征选择的的降维。

基于特征的选择指的是根据一定规则和经验，直接选取原有维度的部分参与到后续的计算和建模过程，用选择的维度代替所有维度，这个过程不产生新的维度。这种方式的好处在于，所选择的维度保留了原有维度的业务含义，可以用于后续的知识模式解读和业务理解，从而保证了最终的可应用性。

基于特征选择的降维方法通常有四种，如下图所示：