来自于Simple Learning Pro的系列
相关性
为了描述两个变量之间的相关关系,我们一般可以采用散点图用于描述。
这两个变量,我们把其中一个称为解释变量,也是自变量;一般放于X轴;另一个称为自变量,一般放于Y轴
描述相关性(r)时有两个要素:
相关性的方向:正相关 or 负相关
相关性的强弱:越接近于1/-1表示相关性越强
![](https://img.haomeiwen.com/i16482678/343525858a6176cf.png)
回归方程和R-squared
为了对两个变量之间的相关关系做更好的描述,我们可以引入回归方程;
Y=b0+b1*X;其中b0为截距,b1为相关系数
同时我们引入R-squared(上文中r的平方)来反映回归方程整体的拟合度,表达因变量与所有自变量之间的总体关系。R²等于回归平方和在总平方和中所占的比率,即回归方程所能解释的因变量变异性的百分比。
![](https://img.haomeiwen.com/i16482678/2fce49b474f143e8.png)
残差
残差:观测值与拟合值的偏离,残差大小可以衡量预测的准确性;
在回归中也要注意异常值点
![](https://img.haomeiwen.com/i16482678/a023ee9b9174e25f.png)
网友评论