一. 相关系数
1.1 关系
关系分为两种:
-
函数关系
确定关系,例如: y=3+10*x -
相关关系
非确定关系
image.png
1.2 相关系数概述
我们使用相关系数这一指标去衡量两个变量之间的线性关系程度。
![](https://img.haomeiwen.com/i2638478/baf893f8db7fb0d8.png)
![](https://img.haomeiwen.com/i2638478/2cff9c87a6b29451.png)
1.3 相关系数公式
要求:
- 成为数据(x,y)组成的样本是一个随机样本
- 数据对(x,y)的散点图要呈现出近视线性相关性
- 要把离群值排除
相关系数计算公式:
![](https://img.haomeiwen.com/i2638478/63a359b124b714fd.png)
1.4 相关系数r的性质
r的性质:
-
r的范围是-1到1
-
如果某个变量的所有值都转换为一个不同的度量单位,r值不变。
-
r值不受x、y的选择影响。交换所有的x值与y值,r不便。
-
r是线性相关性的强度的度量,不适用于非线性相关的关系。
-
r非常容易受到离群值的影响,当有离群值存在的时候,r可能变得非常不一样
1.5 可解释变异
Y变异的来源:
- x变异造成的-可解释变异
- 除x外的因素变异造成的,如随机抽样引起的误差
放映了y变异中由x变异引起的变异所占总变异的比例,也就是
的值是由x和y之间的线性相关性说解释的y的变异变异比例。
1.6 常见错误
- 误将相关关系认为是因果关系
- 局部求平均数后再用于计算会使变异减少,相关性增大
- 不存在线性相关性,不意味着两个变量没有关系,可能会存在其他非线性关系
1.7 相关系数
![](https://img.haomeiwen.com/i2638478/62ee2a33363e8a2d.png)
例子:
![](https://img.haomeiwen.com/i2638478/9117d3cdd514f69f.png)
![](https://img.haomeiwen.com/i2638478/bc386be5dd9cded1.png)
![](https://img.haomeiwen.com/i2638478/35213baef5ff9569.png)
二. 回归模型
![](https://img.haomeiwen.com/i2638478/251404f14337bc8e.png)
2.1 一元线性回归模型
![](https://img.haomeiwen.com/i2638478/a5160aa2884cf3b9.png)
![](https://img.haomeiwen.com/i2638478/0e44866e223c6bbf.png)
2.1.1 如何确定参数
![](https://img.haomeiwen.com/i2638478/3eb697d1bf9fc3d9.png)
![](https://img.haomeiwen.com/i2638478/90cfba4548ac0edf.png)
例子:
![](https://img.haomeiwen.com/i2638478/5fdd230dd2360817.png)
2.1.2 回归系数显著性检验
![](https://img.haomeiwen.com/i2638478/850a551161fa67fa.png)
![](https://img.haomeiwen.com/i2638478/ac533bdbf4cf151f.png)
![](https://img.haomeiwen.com/i2638478/2dd92a9b75845397.png)
例子:
![](https://img.haomeiwen.com/i2638478/9c158a59afc7f316.png)
2.1.3 回归诊断-残差图
![](https://img.haomeiwen.com/i2638478/a59b6bea3c29f175.png)
2.2 多元线性回归模型
![](https://img.haomeiwen.com/i2638478/e70402658a982367.png)
参数估计:
![](https://img.haomeiwen.com/i2638478/25a3272569b568fc.png)
![](https://img.haomeiwen.com/i2638478/22e291c05d427d31.png)
![](https://img.haomeiwen.com/i2638478/82d4696c037b007b.png)
例子:
![](https://img.haomeiwen.com/i2638478/355b80659a352d78.png)
三. 虚拟变量
![](https://img.haomeiwen.com/i2638478/d3fe1b6e8a2adeaf.png)
网友评论