美文网首页
特征工程之共线性

特征工程之共线性

作者: 清梦载星河 | 来源:发表于2020-02-15 20:38 被阅读0次

1. 共线性问题的基本概念

特征间共线性

  • 两个或多个特征包含了相似的信息,相互之间也存在强烈的相关关系。

常用判断标准

  • 两个或两个以上的特征之间的相关性系数高于0.8

共线性的影响

  • 降低运算效率
  • 降低一些模型的稳定性
  • 弱化一些模型的预测能力

处理方式

  • 删除。一组相互共线的特征中只保留与因变量相关性最高的一个
  • 变换。对共线的特征进行求比值、求差等变换计算

2. 相关模块或函数

  • pandas.DataFrame.corr():用于查看相关性系数
  • seaborn.heatmap():如果特征比较多,可以借助热力图来更直观地找出共线性的变量。

相关文章

  • 特征工程之共线性

    1. 共线性问题的基本概念 特征间共线性 两个或多个特征包含了相似的信息,相互之间也存在强烈的相关关系。 常用判断...

  • 在Python中实现多重共线性的可视化

    在Python中实现多重共线性的可视化 网络图的胜利。 简介什么是多重共线性? 多重共线性是指两个或更多的特征之间...

  • 主成分分析

    在有限的数据集下,过高的数据维数会导致维度灾难; 降维的方法包括特征提取和特征选择; 主成分分析是将原始共线性的特...

  • 数学特征工程之特征分析

    本文涉及到四个关键词:特征、特征工程、分析、特征分析。 对”特征”和”特征工程”理解,建议先阅读本人今日头条上的两...

  • 特征工程之特征缩放&特征编码

    机器学习入门系列(2)--如何构建一个完整的机器学习项目,第五篇! 该系列的前四篇文章: 机器学习入门系列(2)-...

  • 特征工程之_筛选

    1. 说明  本文并非介绍某个成熟算法或者工具,只是个人的一点感悟,写得可能不正确,不全面,希望能给大家带来...

  • 特征工程之类别特征处理

    类别特征(Categorical Feature)指的是能在有限范围内取值的特征,如性别(男,女),血型(A,B,...

  • 基因家族分析(9)物种间的共线性分析及jcvi绘图

    物种间的共线性 数据准备 种间共线性分析仍然使用 mcscanx 软件,这里用拟南芥和苦荞之间的共线性分析举例。需...

  • 数据预处理和特征衍生

    特征信息度的计算和意义 变量的共线性,线性相关性 信息冗余 加剧后期验证,部署,监控的负担 变量挑选的依据 带约束...

  • 聊聊“基因组共线性”

    最近看了几篇关于共线性分析的微信/简书推送,发现不少研究人员把“编码基因共线性”错误地描述为“全基因组共线性”。这...

网友评论

      本文标题:特征工程之共线性

      本文链接:https://www.haomeiwen.com/subject/ihayfhtx.html