提出背景
- 房屋房价预测
面积 | 房间数 | 楼层数 | 价格 |
---|---|---|---|
2104 | 5 | 1 | 460 |
1416 | 3 | 2 | 232 |
1534 | 3 | 2 | 315 |
- 术语转换
矩阵表示
- 将上房屋特征 和房价 矩阵化
- 将上式 转换为矩阵乘
为什么要这么转换呢,因为计算机很擅长于做矩阵运算
- 给上式加一个截距 变成
这种形式,
为截距
上式的截距为
令
截距为
-
我们将上式,表示形为
-
我们的目标是 求出
让他更好的去拟合给出的数据
我们是使用损失函数来判断 拟合的好坏 ,注意
- 损失函数 定义为
这是一个 只与
有关的函数 ,我们的目标,是让这个损失函数最小。
一般情况,上标表示输入的行数,下标表示 列的特征值
其中:
梯度下降法
- 思路 描述
函数上 任选一个起始点,在这点上 选择一个 下降速度最快的方向(梯度),移动一小步(学习率),求得新的函数值。与上一点函数值比较,如果小于上点函数值,重复原来的操作。继续下降,直至最小值。
- 概念引出
梯度 和 学习率
- 损失函数的偏导 (n+1)个
多项式回归
- 欠拟合
上面 是使用线性模型 训练数据的 非线性 函数,为了防止一次方程的欠拟合现象,我们可以增加模型的复杂度,创造一个多次方程进行拟合。
- 举例
转化为:
问题就转化成了
这种思路还可以解决异或问题(挺不错)
- 正则化
解决过拟合现象,将参数也加入到损失函数中,联合进行评估。
- 领回归
岭回归通过对系数施加惩罚来解决最小二乘法的缺点
网友评论