“菩萨畏因、凡人畏果”,因果律深入人心。也就是说,现在我们的处境,其实是以前种下种子,生长成的结果。再换个说法,那么同样结果呈现一定有原因。
把自己当作“菩萨”深入想想,原因是什么,不是一下就能说明白的,要分解成好多小问题才能清晰解答。1、造成结果,原因是一个还是多个?2、如果有多个,它们之间是否也同样互相影响?3、多个原因分别对结果的影响程度大小是否有不同?4、对结果影响不同的原因我们关注那几个重要的?
多元回归分析提供一种方式,能够让人们比较清楚的步步为营、探查究竟。我们带着满脑袋的问题进入游戏,攻破关卡、逐一解决,最后结论会显现。
第一步:整理思维 世界是复杂多变的,如果有因果,绝不可能只有一个。建立一个接贴近事实,又足够简化便于利用方法,需要浪费些脑细胞。
那盖房子做个比喻吧。单因素回归分析是制作一块砖头(原因,即自变项);多元回归分析就是把两块、三块砖头堆砌起来。除了制作砖头,还要建立砖头之间的联系,最后才能得到“大屋子”(分析结果)。
第二步:分析过程
1、知道有很多原因(自变项)不停同时变化,影响着我们关注结果(因变项)。为了便于分析假设:一个瞬间,只有一个自变项在变化,其他自变项都没变。我们看看它到底有多大效果。—双变项回归分析前几篇文章统计学9、10、11、12已经详细叙述了。现在看看如何控制其他变项不变时,自变项与因变项的变化。
例子:薪资(因变项)与教育程度、是否经理、种族分析(自变项)。
种族与薪资,其他不变。具体见下图。
控制其他变量2、全面找寻影响因素是收集材料的目的,自变项缺失就会导致无法控制,大大影响结果。
3、多个自变项选取的角度有可能完全相同、部分相同、完全不同。它们之间互相影响,效果叠加在一起,需要分离。那么按影响程度划分,原因有大小之分、我们仍然不能确定谁是“主犯”、谁是“从犯”。应该特别关注谁、注意谁、忽略谁。衡量指标是“净回归系数”
第三步:分析过程中的注意事项
1、特别关注的因素(变项)作为预测变项。比如:种族作为预测变项,而薪资作为因变项。
2、高度相关几个自变项,之间出现共线(相似),结果会出现,自变项与因变项无关的结果。比如:教育程度(年数)与上学的年数两个自变项,对于薪资的影响。这两个自变项基本是一回事,在净回归系数图中显示的F值很大,则D、G值几乎为零,结果自然显示为“无关”。
3、回归系数R,在二元回归中有正负之分,即正、负相关;而在多元回归中,多因素影响的结果,没有正负之分。
4、判定系数R2趋近于1时,模型设计贴近现实。比如:平均值像马褂一样展现体型;二元回归分析像西装一样展现体型;多元回归分析像内衣一样展现体型。后者比前者更贴近现实。
总结:
。
网友评论