美文网首页
七、降维

七、降维

作者: 一闪一闪亮日日日日日日 | 来源:发表于2018-10-21 13:01 被阅读0次

降维原因:
1、冗余,特征相关度高,容易消耗计算性能
2、噪声,部分特征对预测结果有影响
主要方法:
1、Filter过滤式(VarianceThreshold) 方差大小,考虑所有样本这个特征的数据情况
2、Embedded嵌入式(正则化,决策树)
3、Wrapper(包裹式)
4、神经网络

1 数据降维之特征选择(过滤式)

特征选择:删除低方差的特征
删除特征取值差不多的特征

from sklearn.feature_selection import VarianceThreshold
def var():
    var = VarianceThreshold(threshold=0.0)
    data = var.fit_transform([[0,2,0,3],[0,1,4,3],[0,1,1,3]])
    print(data)
if __name__=='__main__':
    var()

输出:
[[2 0]
[1 4]
[1 1]]

2 数据降维之主成分分析

PCA,特征数量达到上百的时候,考虑数据的简化问题,数据也会改变,特征数量会减少,信息损耗少
n_components:
小数:0-1 保留多少信息,比如90%,一般90%-95%
整数:减少到的特征数量,一般不用

from sklearn.decomposition import PCA
def pca():
    pca = PCA(n_components=0.9)
    data = pca.fit_transform([[2,8,4,5],[6,3,0,8],[5,4,9,1]])
    print(data)
if __name__=='__main__':
    pca()

输出:
[[ 1.22879107e-15 3.82970843e+00]
[ 5.74456265e+00 -1.91485422e+00]
[-5.74456265e+00 -1.91485422e+00]]

相关文章

  • 七、降维

    降维原因:1、冗余,特征相关度高,容易消耗计算性能2、噪声,部分特征对预测结果有影响主要方法:1、Filter过滤...

  • 单细胞笔记5-tSNE和UMAP

    降维 降维顾名思义就是把数据或特征的维数降低,一般分为线性降维和非线性降维,比较典型的如下: 线性降维:PCA(P...

  • 浅谈“降维打击”思维

    浅谈“降维打击”思维 导语:降维打击,顾名思义,首先要降维。降维打击就是将攻击目标本身所处的空间维度降低,致使目...

  • 降维打击,升级认知

    “降维打击”不是让自己降维去打击,而是通过把对方的维度降低,抽走三维的一维变成二维的,实现打击。“降维打击”这个科...

  • 知识碎片2(含日记)

    一、知识碎片 1.粥佐罗:升维训练、降维打击;升维输入、降维输出 升维训练、降维打击:一位女拳击运动员,对待比赛非...

  • 降维攻击学习笔记

    最近刚看了降维攻击的概念,那什么叫做降维攻击,为什么要降维攻击,怎么实现降维攻击呢?以下是我在互联网上看了一些资料...

  • C语言数组的升维与降维之说

    C语言数组的升维与降维之说 C语言数组的升维 C语言数组的降维

  • 三宝妈百日分享之十四 降维打击

    “降维打击”出自中国最牛逼的科幻作家刘慈欣的《三体》中,原文是“降维攻击”,后来都用成“降维打击”。指的是...

  • 降维总结

    降维

  • 排除雷区,享受天堂———实用性与理论性文章的降维阅读法(一)

    --------------- 大纲:为什么要用降维阅读·什么是降维阅读·一步阅读法·二步阅读法·三步阅读法·降维...

网友评论

      本文标题:七、降维

      本文链接:https://www.haomeiwen.com/subject/rtlbzftx.html