美文网首页动物世界的科学理论
关于多重共线性的一点感想

关于多重共线性的一点感想

作者: 黑猫中度烘焙 | 来源:发表于2017-12-31 00:21 被阅读26次

多重共线性是指多变量线性回归中,变量之间由于存在高度相关关系而使回归估计不准确。比如虚拟变量陷阱(英语:Dummy variable trap)即有可能触发多重共线性问题。
————维基百科

在科学研究问题中,共线性绝对是一个很让人头大的问题,只要不是统计学专业,绝对对这个问题有过很长时间的纠结,纠结的问题则是是否去除变量,很多情况下,我们使用方差膨胀因子VIF = 1 / (1-R^2) 来处理共线性问题,并且选择10作为处理变量的阈值,如果样本量很大,则选择3,甚至2作为阈值去除变量。如此一来,导致了一些潜在问题,如果变量本身不多,只有3个,去除掉某个变量后自然会使得另外2个变量的影响发生改变,这种改变是否真实则不敢下定论。

虽然本身不是统计学专业,但是从多年数据分析的经验来看,变量之间的相关性是存在的,比如在分类学中,对于头骨标本的测量值,头骨不同部位的测量值之间绝对存在共线性,这种共线性来源于进化发育,不可能有个动物的眼眶长和颅骨长是完全独立发育的;又或者说生态学中,共线性来自于生态系统变量之间的相互作用,降雨量和温度,海拔和气压的关系等都存在共线性。是否说为了解决共线性的问题,我非得去除变量以满足模型假设不可?

最近看了一些关于这个问题的讨论,略有所获,引用知乎慧航的解释。

共线性会让人得到不显著的结果,换句话说,如果结果显著,则不必担心共线性的问题。
——慧航

现在来说,很多手段都可以躲避这个问题,比如主成分回归、岭回归、机器学习等,如果不在乎变量分析,显然这些是更好的手段。从本身从事的专业角度来说,我们也并不追求显著结果,自然科学中没有理论基础的显著性的结果并没有太大意义,尤其是近年来对p值显著性的争论也越来越多。但是我还是非常赞同慧航大神的解释,共线性通过影响变量之间的关系改变模型整体结果。由此,解决共线性的问题就变成了解决模型的问题,如果模型是为了解释变量对于因变量的影响,可以通过模型筛选的手段进行排序,共线性则可以忽略,或者作为一个解释角度引入;如果模型是为了筛选出重要的变量,共线性则作为一种依据,筛选得出影响最大的变量以及对模型的边际影响效果。

相关文章

  • 关于多重共线性的一点感想

    多重共线性是指多变量线性回归中,变量之间由于存在高度相关关系而使回归估计不准确。比如虚拟变量陷阱(英语:Dummy...

  • 在Python中实现多重共线性的可视化

    在Python中实现多重共线性的可视化 网络图的胜利。 简介什么是多重共线性? 多重共线性是指两个或更多的特征之间...

  • 关于一点感想

    我发现,跟有些人就是说不通。 无论你怎么讲,他就是听不进去。 非要来反驳你,气势汹汹的。 也罢,跟这种人置气才是真...

  • 多重共线性、异方差和自相关性

    1.多重共线性 多重共线性是解释变量存在线性关系或者近似的线性关系,多重共线性影响的模型一般为底层是线性的模型,例...

  • 关于读书的一点感想

    小时候的读书,就是学习好,有个好成绩。 甚至大学毕业之前,读书的更多解释可能就是成绩。 但在毕业之后的读书,就是一...

  • 关于“紧张”的一点感想

    嗨 我决定来肆意的书写一次 我是一个紧张成性的人,即使已经找到了很多好方法来应对,可我还是能敏锐的抓住这份天生的紧...

  • 关于生活的一点感想

    生活不易!一方面要自己过的舒心,另一方面,还有世俗价值观的约束,在这两者的共同作用下,成就此时此刻的自我。 ...

  • 关于艺术的一点感想

    现在很多家长都会送孩子去学画画做美工,绝大多数孩子也都喜欢画,在不会写字的阶段,画画是他们表达自己认知的一种方式。...

  • 关于码字的一点感想

    我在这个公众号的第一次推送是在今年五月七日,到目前为止已经过去五个月,在这五个月里我总共推送二十四次,我很开心自己...

  • 关于教育的一点感想

    01 从小到大都被教育着,可是却不知道,一路走过来,却是一直被“套路”着。 被家长“套路”、被老师“套路”、被校长...

网友评论

    本文标题:关于多重共线性的一点感想

    本文链接:https://www.haomeiwen.com/subject/texogxtx.html