美文网首页
降为算法的优缺点

降为算法的优缺点

作者: STACK_ZHAO | 来源:发表于2019-08-27 21:38 被阅读0次

    缺失值比率:如果数据集的缺失值太多,我们可以用这种方法减少变量数。
    低方差滤波:这个方法可以从数据集中识别和删除常量变量,方差小的变量对目标变量影响不大,所以可以放心删去。
    高相关滤波:具有高相关性的一对变量会增加数据集中的多重共线性,所以用这种方法删去其中一个是有必要的。
    随机森林:这是最常用的降维方法之一,它会明确算出数据集中每个特征的重要性。
    前向特征选择和反向特征消除:这两种方法耗时较久,计算成本也都很高,所以只适用于输入变量较少的数据集。
    因子分析:这种方法适合数据集中存在高度相关的变量集的情况。
    PCA:这是处理线性数据最广泛使用的技术之一。
    ICA:我们可以用ICA将数据转换为独立的分量,使用更少的分量来描述数据。
    ISOMAP:适合非线性数据处理。
    t-SNE:也适合非线性数据处理,相较上一种方法,这种方法的可视化更直接。
    UMAP:适用于高维数据,与t-SNE相比,这种方法速度更快。

    相关文章

      网友评论

          本文标题:降为算法的优缺点

          本文链接:https://www.haomeiwen.com/subject/siwyectx.html