001-线性回归

作者: 不懂球的2大业 | 来源:发表于2021-01-15 20:34 被阅读0次

001-线性回归
机器学习实战——回归
线性回归模型
通俗得说线性回归算法（二）线性回归实战
第一次打卡
2020-02-14
逻辑回归和线性回归对比
算法概述-02
【机器学习实践】有监督学习：线性分类、回归模型
统计学习基础复习浓缩版

1.基本原理

1.1概念：

线性回归是一种对自变量和因变量之间关系进行建模的回归分析。自变量就是样本的特征向量 $x \in R^{D}$ （ $x$ 有 $D$ 个维度），因变量是标签 $y$ 。线性回归假设模型是线性函数：
$f(x;w,b) = w^{T}x+b$ 。
（ $x$ 形状为 $D*1$ ， $w$ 也是 $D*1$ ， $w^{T}$ 为 $1*D$ ，因此最后的结果 $w^{T}x+b$ 是一个数字）。
为了简单，我们写成：
$f(x;\hat w) = \hat w^{T} \hat x$ ，其中 $\hat w^{T}$ 和 $\hat x$ 分别称为增广权重向量和增广特征向量。
$\hat x=$ $\begin{bmatrix} x_{1} \\ \vdots \\x_{D} \\1 \end{bmatrix},\hat w=$ $\begin{bmatrix} w_{1} \\ \vdots \\w_{D} \\b \end{bmatrix}$ 。
（ $\hat x$ 形状为 $(D+1)*1$ ， $\hat w$ 也是 $(D+1)*1$ ）。
为了简化表示方法，直接使用 $w$ 和 $x$ 分别表示增广权重矩阵和增广特征向量。这样，线性回归的模型简写为 $f(x;w) = w^{T}x$ 。

最小二乘法

1.2参数学习方法：

1.2.1最小二乘法：

由于线性回归的标签 $y$ 和模型输出都为连续的实数值，因此平方损失函数非常合适。根据经验风险最小化准则，训练集 $D$ 上的经验风险定义为：

$\begin{equation}\begin{split} R(w) &= \sum_{i=1}^{N} L(y^{(i)},f(x^{(i)};w)) \\ &= \frac {1}{2} \sum_{i=1}^{N}(y^{(i)}-w^{T}x^{(i)})^{2} \\ &= \frac{1}{2}||y-x^{T}w ||^{2} \end{split}\end{equation}$
其中 $y = [y^{(1)},...,y^{(N)}]^{T} \in R^{N}$ 是由所有样本的真实标签组成的列向量，而 $x \in R^{(D+1)*N}$ 是所有样本的输入特征 $x^{(1)},...,x^{(N)}$ 组成的矩阵：
$\begin{pmatrix} x_{1}^{(1)}&x_{1}^{(2)}&\cdots & x_{1}^{(N)}\\ \vdots&\vdots&\ddots&\vdots\\ x_{D}^{(1)}&x_{D}^{(2)}&\cdots & x_{D}^{(N)}\\ 1&1&\cdots &1\\ \end{pmatrix}$
风险函数 $R(w)$ 是关于 $w$ 的凸函数，其对 $w$ 的偏导数为(结果的形状 $(D+1)*1$ )：
$\begin{equation}\begin{split} \frac{\partial R(w)}{\partial w} &= \frac {1}{2} \frac {\partial || y - x^{T}w||^{2}}{\partial w} \\ &= -x(y-x^{T}w) \end{split}\end{equation}$
令导数等于0，即 $\frac {\partial}{\partial w} R(w) = 0$ 得到最优参数为：
$\begin{equation}\begin{split} w^{\ast} = (xx^T)^{-1}xy \end{split}\end{equation}$

1.2.2梯度下降法：

在最小二乘法中， $xx^{T} \in R^{(D+1)*(D+1)}$ 必须存在逆矩阵，即 $xx^{T}$ 是满秩的。当 $xx^{T}$ 不可逆时，可以使用梯度下降法来估计参数。先初始化 $w = 0$ ，然后通过下面公式进行迭代：
$\begin{equation}\begin{split} w \leftarrow w+\alpha x(y-x^{T}w) \end{split}\end{equation}$

2.编程实现

2.1最小二乘法

class LinearRegression:
    def __init__(self):
        self.basis_func = None
        self.phi0 = None
        self.phi1 = None
        self.phi = None
        self.w = None
    
    def identity_basis(self,x):
        ret = np.expand_dims(x,axis=1)
        return ret
    
    def fit(self,x_train,y_train):
        self.basis_func = identity_basis
        self.phi0 = np.expand_dims(np.ones_like(x_train),axis = 1)
        self.phi1 = self.basis_func(x_train)
        self.phi = np.concatenate([self.phi0,self.phi1],axis=1)
        self.w = np.dot(np.linalg.pinv(self.phi),y_train)
        
    def predict(self,x):
        phi0 = np.expand_dims(np.ones_like(x), axis=1)
        phi1 = self.basis_func(x)
        phi = np.concatenate([phi0, phi1], axis=1)
        y = np.dot(phi, self.w)
        return y
    
    def evaluate(self,y_predict, y_true):
        std = np.sqrt(np.mean(np.abs(y_predict - y_true) ** 2))
        return std

2.2梯度下降法

class LinearRegression:
    def __init__(self):
        self.basis_func = None
        self.phi0 = None
        self.phi1 = None
        self.phi = None
        self.w = None
    
    def identity_basis(self,x):
        ret = np.expand_dims(x,axis=1)
        return ret
    
    def derivation(self,theta,phi,y):
        return phi.T.dot(phi.dot(theta)-y)*2.0/len(phi)
    
    def gradient(self,phi,y,initial_theta,eta=0.0001,n_iters = 10000):
        w = initial_theta
        for i in range(n_iters):
            grad = self.derivation(w,phi,y)
            w = w - eta*grad
        return w
    
    def fit(self,x_train,y_train):
        self.basis_func = identity_basis
        self.phi0 = np.expand_dims(np.ones_like(x_train),axis = 1)
        self.phi1 = self.basis_func(x_train)
        self.phi = np.concatenate([self.phi0,self.phi1],axis=1)
        initial_theta = np.zeros(self.phi.shape[1])
        self.w = self.gradient(self.phi,y_train,initial_theta)

    def predict(self,x):
        phi0 = np.expand_dims(np.ones_like(x), axis=1)
        phi1 = self.basis_func(x)
        phi = np.concatenate([phi0, phi1], axis=1)
        y = np.dot(phi, self.w)
        return y
    
    def evaluate(self,y_predict, y_true):
        std = np.sqrt(np.mean(np.abs(y_predict - y_true) ** 2))
        return std

参考文献：
1.邱锡鹏，神经网络与深度学习，机械工业出版社，https://nndl.github.io/, 2020.
2.https://www.cnblogs.com/cxq1126/p/13293262.html

001-线性回归
1.基本原理 1.1概念：线性回归是一种对自变量和因变量之间关系进行建模的回归分析。自变量就是样本的特征向量（有...
机器学习实战——回归
本章内容】线性回归局部加权线性回归岭回归和逐步线性回归例子【线性回归】 wHat = (X.T*X).I...
线性回归模型
参考：1.使用Python进行线性回归2.python机器学习：多元线性回归3.线性回归概念线性回归模型是线性模...
通俗得说线性回归算法（二）线性回归实战
前情提要：通俗得说线性回归算法（一）线性回归初步介绍一.sklearn线性回归详解 1.1 线性回归参数介绍完...
第一次打卡
线性回归主要内容包括：线性回归的基本要素线性回归模型从零开始的实现线性回归模型使用pytorch的简洁实现线性回...
2020-02-14
线性回归：线性回归分为一元线性回归和多元线性回归，一元线性回归用一条直线描述数据之间的关系，多元回归是用一条曲线描...
逻辑回归和线性回归对比
简单说几点线性回归和逻辑回归都是广义线性回归模型的特例。他们俩是兄弟关系，都是广义线性回归的亲儿子线性回归只能...
算法概述-02
1.逻辑回归和线性回归的联系和区别：逻辑回归和线性回归的都是广义的线性回归。线性回归是根据最小二乘法来建模，逻...
【机器学习实践】有监督学习：线性分类、回归模型
线性模型为线性模型分类和回归的区别分类：离散回归：连续本文主要关注线性回归模型常用线性回归模型类型 OLS...
统计学习基础复习浓缩版
1.简单线性回归 2.多元线性回归 3.多项式回归 4.广义线性回归(含逻辑斯谛回归）广义线性回归模型通过拟合响...