假设数据集 D 中共有 m 个样本,每个样本共有 n 个特征,1 个样本标签,则每个样本组成为 , i = 1, 2, ..., m
为第 i 个样本的标签预测值,
为 m x 1 的行向量,
为 m x n 的矩阵,而
为 1 x (n + 1) 的列向量,而
为 (n + 1) x 1 的行向量
故线性回归目标函数可表示为
为了方便使用矩阵表示,可假设 ,则上式可表示为
,
可进一步简化表示为 ,又可使用矩阵进一步简化为
,
故损失函数可定义为:
平方误差:
注: 只是为了在求导时,将 2 消去
故对 的
求偏导数可得:
而由梯度下降法可得:
其中 t 表示第 t 步的迭代,而 则表示步长
网友评论