多重线性回归模型是指用回归方程描述一个因变量与多个自变量的依存关系,简称多重回归,其基本形式为:Y= a + bX1+CX2+***+NXn。
构建步骤具体如下:
1、对数据进行描述统计。如果发现数据的标准差大于均值,这说明该数据存在异常值。
2、若数据存在异常值,需要对数据进行异常值的处理。对于异常值的处理,可以将原数据转换成对数;也可以在(均值-3倍标准差,均值+3倍标准差)内的值替换;当然,样本数据较小的话可以用均值替代。
3、数据进行预处理后。需要对处理过后数据绘制散点图,以确保线性趋势的存在。
4、初步建模,包括变量的筛选和变量的选择方法。需要注意的是自变量与自变量之间是否存在多重共线性,若存在可以利用主成份分析法合并为一个变量,然后将合并后的新变量和其余自变量一起纳入模型做回归。除了主成份分析法外,还有逐步回归和岭回归法。
5、残差分析。可以通过观察P-P图的数据点是否基本围绕在45度的线上,若是,则说明该线性拟合较好。
6、经过以上的步骤,研究者才能得到一个统计学上无误的模型,下一步则是结合专业实际,报告相应结果。
网友评论