美文网首页
机器学习笔记6-特征选择和特征提取

机器学习笔记6-特征选择和特征提取

作者: 江湾青年 | 来源:发表于2021-09-26 22:12 被阅读0次

特征选择和特征提取

  • 特征选择(feature selection)和特征提取(Feature extraction)都属于降维(Dimension reduction)
  • 这两者达到的效果是一样的,就是试图去减少特征数据集中的属性(或者称为特征)的数目;但是两者所采用的方式方法却不同。
  • 特征提取的方法主要是通过属性间的关系,如组合不同的属性得到新的属性,这样就改变了原来的特征空间
  • 特征选择的方法是从原始特征数据集中选择出子集,是一种包含的关系,没有更改原始的特征空间。

特征提取的主要方法:

  • PCA,LDA,SVD等。(SVD本质上是一种数学的方法, 它并不是一种什么机器学习算法,但是它在机器学习领域里有非常广泛的应用)

特征选择的方法

1、Filter方法

  • 其主要思想是:对每一维的特征“打分”,即给每一维的特征赋予权重,这样的权重就代表着该维特征的重要性,然后依据权重排序。
  • 主要的方法有:Chi-squared test(卡方检验),ID3(信息增益),correlation coefficient scores(相关系数)

2、Wrapper方法:

  • 其主要思想是:将子集的选择看作是一个搜索寻优问题,生成不同的组合,对组合进行评价,再与其他的组合进行比较。这样就将子集的选择看作是一个是一个优化问题,这里有很多的优化算法可以解决,尤其是一些启发式的优化算法,如GA,PSO(粒子群算法),DE,ABC(人工蜂群算法)等。
  • 主要方法有:recursive feature elimination algorithm(递归特征消除算法)

3、Embedded方法

  • 其主要思想是:在模型既定的情况下学习出对提高模型准确性最好的属性。这句话并不是很好理解,其实是讲在确定模型的过程中,挑选出那些对模型的训练有重要意义的属性。
  • 主要方法:正则化。如岭回归就是在基本线性回归的过程中加入了正则项。

特征选择的目标

  • 引用自吴军《数学之美》上的一句话:一个正确的数学模型应当在形式上是简单的。构造机器学习的模型的目的是希望能够从原始的特征数据集中学习出问题的结构与问题的本质,当然此时的挑选出的特征就应该能够对问题有更好的解释,所以特征选择的目标大致如下:
    • 提高预测的准确性
    • 构造更快,消耗更低的预测模型
    • 能够对模型有更好的理解和解释

最后总结之

  • 特征提取是从杂乱无章的世界中,去到更高层的世界去俯瞰原始世界,你会发现很多杂乱无章的物理现象中背后暗含的道理是想通的,这时候你想用一个更加普世的观点和理论去解释原先的理论,这个是特征提取要做的事情。
  • 而你仍呆在原始世界中,只是想对现有的“取其精华,去其糟粕”,这个是所谓特征选择。只是对现有进行筛选。
  • 特征提取和特征选择统称为降维。(Dimension Reduction)

参考文章:

机器学习中的特征——特征选择的方法以及注意点
数据降维(特征提取)和特征选择有什么区别?
https://blog.csdn.net/qq_41996090/article/details/88076031

相关文章

  • 机器学习笔记6-特征选择和特征提取

    特征选择和特征提取 特征选择(feature selection)和特征提取(Feature extraction...

  • 6.10  特征处理

    整理一下建模前的步骤:特征提取,特征转换,特征选择对机器学习(传统机器学习和深度学习)建模都是非常重要的环节。 补...

  • 特征工程

    数据和特征决定了机器学习的上限,模型和算法只是逼近这个上限。特征工程对原始数据进行特征提取、特征预处理、特征选择等...

  • 深度学习方法VS传统机器学习

    传统机器学习算法:输入——人工特征提取——权重学习——预测结果 深度学习算法:输入——基础特征提取——多层复杂特征...

  • 1.2、机器学习算法的过程

    ①特征提取,特征选择特征提取:通过训练样本获得的对机器学习任务有帮助的多维度数据。②不同算法对特征空间做不同的划分...

  • feature selection & feature extr

    1、概述——特征选择 & 特征提取 特征选择(feature selection)和特征提取(feature ex...

  • Spark MLlib机器学习开发指南(6)--特征提取--Co

    Spark MLlib机器学习开发指南(6)--特征提取,转换,选择--CountVectorizer 翻译自Co...

  • 机器学习中,有哪些特征选择的工程方法

    转:知乎 特征选择是特征工程中的重要问题(另一个重要的问题是特征提取),坊间常说:数据和特征决定了机器学习的...

  • Spark mllib

    mllib 包括三个核心机器学习功能 1 数据准备 特征提取 变换 选择 分类特征的散列 自然语言处...

  • 声学特征提取and WORLD Using

    title: 声学特征提取and WORLD Usingtags: 深度学习,机器学习,数据挖掘,grammar_...

网友评论

      本文标题:机器学习笔记6-特征选择和特征提取

      本文链接:https://www.haomeiwen.com/subject/vhpcnltx.html