美文网首页读书简友广场每天写1000字
深度挖掘学习之基于特征选择的降维方法

深度挖掘学习之基于特征选择的降维方法

作者: 皮皮杂谈 | 来源:发表于2019-06-09 01:07 被阅读7次

在对海量数据或大数据进行数据挖掘时,通常会面临“维度灾难”,原因是数据集的维度可以不断增加直至无穷多,但计算机的处理能力和速度却是有限的;另外,数据集的大量维度之间可能存在共线性的关系,这会直接导致学习模型的健壮性不够,甚至很多时候算法结果会失败。因此,我们需要降低维度数量并降低维度间共线性的影响。

数据降维也被称为数据规约或数据约减,其目的是减少参与数据计算和建模维度的数量。一种典型的数据降维思路是基于特征选择的的降维。

基于特征的选择指的是根据一定规则和经验,直接选取原有维度的部分参与到后续的计算和建模过程,用选择的维度代替所有维度,这个过程不产生新的维度。这种方式的好处在于,所选择的维度保留了原有维度的业务含义,可以用于后续的知识模式解读和业务理解,从而保证了最终的可应用性。

基于特征选择的降维方法通常有四种,如下图所示:

基于特征选择的降维方法

经验法:通过操作者的以往经验、实际数据情况、业务理解程度等综合考虑选择。

测算法:通过不断测试多种维度选择参与计算,通过结果来反复验证和调整并最终找到最佳特征方案。

基于统计分析的方法:通过相关性分析不同维度间的线性相关性,从相关性高的维度中人工去除或筛选;或者通过计算不同维度间的互信息量,找到具有较高信息量的特征集,然后把其中的一个特征去除或留下。

机器学习算法:通过机器学习算法得到不同特征的特征值或权重,然后再根据权重来选择较大的特征。例如,通过CART决策树模型得到不同变量的重要程度,然后可以根据实际权重值进行选择。

相关文章

  • 深度挖掘学习之基于特征选择的降维方法

    在对海量数据或大数据进行数据挖掘时,通常会面临“维度灾难”,原因是数据集的维度可以不断增加直至无穷多,但计算机的处...

  • 面试题目总结-机器学习算法-基础

    1.机器学习中特征的理解 def:特征选择和降维 特征选择:原有特征选择出子集,不改变原来的特征空间 降维:将原有...

  • PCA降维

    当数据特征较多时,基本有两种方法:1 PCA降维2 Feature Selection(特征选择) PCA降维 <...

  • sklearn学习 — 数据降维

    数据降维 降维:特征的数量 特征选择 主成分分析 特征选择 冗余:部分特征的相关的高,容易消耗计算性能 噪声:部分...

  • 降维与特征选择

    第七章 降维与特征选择 [TOC] 1. 特征抽取和特征选择的区别 特征抽取:在已有的特征上,采用特征变换的方法,...

  • 《机器学习》第11章 特征选择

    1、特征选择 特征选择和降维计算一样,都能有效的减轻维数灾难问题,事实上,特征选择和降维计算是处理高维数据的两大主...

  • 人脸识别基本原理

    特征脸特征脸方法利用主分量分析进行降维和提取特征。主分量分析是一种应用十分广泛的数据降维技术,该方法选择与原数据协...

  • 数据降维之特征选择

    特征选择:就是单纯的从提取到的所有特征中选择部分特征做为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但...

  • 特征选择

    特征选择和降维计算一样,都能有效的减轻维数灾难问题,事实上,特征选择和降维计算是处理高维数据的两大主流技术 什么是...

  • 一起来读西瓜书:第十一章 特征选择与稀疏学习

    1. 章节主要内容 1)子集搜索和评价 特征选择和降维计算一样,都能有效的减轻维数灾难问题,事实上,特征选择和降维...

网友评论

    本文标题:深度挖掘学习之基于特征选择的降维方法

    本文链接:https://www.haomeiwen.com/subject/xcxgxctx.html