【系列】简单线性回归（1）无公式-概念理解

作者: 秋小鱼Sandy | 来源:发表于2017-10-17 14:21 被阅读260次

【系列】简单线性回归（1）无公式-概念理解
回归的分类
线性回归-2-简单线性回归的代码实现
scikit-learn机器学习：多元线性回归
线性回归模型
第三章线性回归
逻辑回归
3 线性回归算法
【机器学习三】线性模型
线性回归模型

这篇文章介绍下简单线性回归的理解。

还是用一个例子来说明。不像在中国，在美国旅游我们会知道，凡是有人为你服务，我们都需要有一定小费的支出，小费的支出比例10%-20%不等。假设小A留学生在一家餐厅打工，他在每服务一桌客户后都会受到一笔小费，他对小费金额做了记录，如下图所示，遗憾的是他没有对每桌客户的消费金额做记录。

而此时，小A希望能够对他下一桌收到的消费做一个预测。然而，当前能够参考的数据少的可怜，仅仅有一个消费金额的数据。于是此时最佳的预测值就是根据以往的小费金额的平均值，我们将这根平均线定义为最佳拟合线（Best-fit line）

然而，这根最佳拟合线和历史数据对比起来是否很理想呢？我们可以进行一个简单的计算，最佳拟合线的第一笔小费的预测值和第一小费实际值差异为-5，第二笔为7。那么将历史数据的所有差异进行加总，为了避免负值抵消正值的效果，我们进行平方后加总。得到：(5-10)^2+(17-10)^2+.......=120。

这里面我们给到一个定义，将120称为线性回归中的残差，英文讲sum of squares of residuals，简写SSE。