例子:
这是一个预测房价的,有一个数据集,包含了某处的房子的大小和价格。
尺寸(x) | 价格(y) |
---|---|
2104 | 460 |
1416 | 232 |
1534 | 315 |
852 | 178 |
... | ... |
现在需要做的就是从这个数据中学习预测房屋价格。
这里说明一下变量定义:
- m = 训练数据集数量
- x = 输入变量,也成特征值(feature)
- y = 输出变量,即目标值
- h = 通过学习算法的到的输出函数(hypothesis function)
我们一般使用(x, y)来表示一个训练样本, 例如上面的(2104, 460)...
用 (, ) 来表示第 i 个训练样本,上标 i 即为数据集的索引,从 1 开始
这张图上,我们通过机器学习算法和数据集来获得一个预测函数h,然后当有新的输入值时,通过这个函数获得新的预测值。
在上面的例子中,新的输入值就是提供一个新的房子尺寸,然后需要得到该房子的预测价格。
如何定义预测函数 h
我们先用一个简单的线性函数来表示:
(有时简单起见,会缩写成)
这意味着这个预测函数是一个线性函数,至于为什么不选择一个复杂的非线性的函数,这是我们都是从简到难,一步步由简单的线性函数到复杂的模型。
这个简单的模型就是线性回归模型( linear regression),而且这是一个单个变量的线性回归模型,单变量即为,这个是根据来预测房价的函数,因此这个模型还有另外一个名称 单变量线性回归
转载自:
https://codeeper.com/2019/12/29/tech/machine_learning/linear_regression_intro.html
网友评论