最近打算重新学习机器学习算法,这篇文章记录线性回归模型。
一、线性回归
给定由个属性描述的示例
,其中
是
在第
个属性上的取值,线性模型(linear model)试图学得一个通过属性的线性组合来进行预测的函数,即
一般用向量形式写成
其中。
和
学得之后,模型就得以确定。
二、算法求解
利用最小二乘对和
进行估计,将给定数据集
表示为一个
大小的矩阵
,其中每行对应于一个示例,该行前
个元素对应于示例的
个属性值,最后一个元素恒置为1,即
再把标记(标签)写成向量形式,则此优化问题为
令,对
求导得到
西瓜书并没有给出求导过程,现在给出推导过程如下
对求导得到
令上式等于零,可得到最优解的闭式解(解析解)。但是由于涉及矩阵逆的计算,需要分类讨论。
当为满秩矩阵或正定矩阵式,令上式等于零可得
但是实际任务中往往不是满秩矩阵,任务的变量数超过样例数,导致
的列数多于行数,此时可求出多个
,它们都能使均方误差最小化,对于这种情况,实际常见的做法是引入正则化(regularization)项。
reference
[1]《机器学习》. 周志华 . 2017
[2] Markdown 数学公式语法 . 2019
网友评论