线性回归中引入核方法

作者: minus_1 | 来源:发表于2019-04-09 14:08 被阅读0次

线性回归中引入核方法
SVM、核方法、SVR基本原理介绍
tensorflow入门应用方法(二)——全连接深度网络搭建
使用SVM支持向量机解决分类问题
说说梯度下降
09-支持向量机（四）线性不可分支持向量机与核函数
SVM支持向量机（三）
相关系数与回归系数
02 SVM - 拉格朗日乘子法
统计基础27：饱和模型与偏差计算R方与p值

2019-04-09

1. 线性回归 (L2-norm)

目标函数：
$L(w) = (Xw - y)^{T}(Xw - y) + \lambda w^{T}w$
最优解： $w = (X^{T}X + \lambda I)^{-1}X^{T}y$

2. 非线性 && 拉伸函数

拟合目标为非线性，例如真实分布如下：
$y = (x, x^{2})(w_1, w_2)^{T} + b$
则在用线性模型拟合时，应考虑将一维 $x \in \mathcal X^{1}$ “拉伸”为二维向量，即对于每个样本特征从一个标量 $x \in \mathcal X^{1}$ 变换为二维向量 $\phi(x) = (x, x^{2}) \in \mathcal X^{2}$ 。 $\phi(.)$ 称为拉伸函数。
假设N个训练样本，记 $\Phi = \Phi(X) = (\phi(X_1), \phi(X_2), ..., \phi(X_N))^{T}$ ，即对每个样本特征进行拉伸后的结果。那么最优解为 (式2-2)：
$w = (\Phi^{T}\Phi + \lambda I)^{-1}\Phi^{T}y$
实际上对于不同任务找到合适的拉伸函数 $\phi(.)$ 几乎是不可能的。所以为了避开这样的寻找过程，引入“核方法”的技巧。

3. 基本的核方法

（如果没有“核方法”的话，我们要找到合适的拉伸函数 $\phi(.)$ ，然后还要计算高维向量的内积，如式2-2）
我们首先把这样的向量内积计算表示为：
$\phi(X_i)^{T}\phi(X_j) = k(X_i, X_j)$
$k(., .)$ 便是所谓的核函数。线性模型的表达式为： $y = \phi(x)^{T}w = w^{T}\phi(x)$

依据式2-2， $w$ 可以表示为 $w = \Phi^{T} \alpha$ (因为都是线性组合?)，结合矩阵乘法 $w$ 可表示为：
$w = \Phi^{T} \alpha = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})$
其中 $\alpha = (\alpha_{1}, \alpha_{2}, ... , \alpha_{n})^{T}$ .

所以，
$y = w^{T}\phi(x) = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})^{T} \phi(x) = \sum_{i=1}^{N} \alpha_{n} k(X_i, x)$

下面求未知向量 $\alpha$ ，记 $K = \Phi\Phi^{T}$ ，有
$L(w) = L(\Phi^{T} \alpha) = (\Phi \Phi^{T} \alpha - y)^{T}(\Phi \Phi^{T} \alpha - y) + \lambda (\Phi^{T} \alpha)^{T}(\Phi^{T} \alpha)$
$= (K\alpha - y)^{T}(K\alpha - y) + \lambda \alpha^{T} K \alpha$
$=\alpha^{T} (K^2 + \lambda K) \alpha - 2y^{T}K\alpha + y^{T}y$
有上式对于 $\alpha$ 的偏导等于 $0$ 可得：
$2(K^2 + \lambda K)\alpha -2yK = 0$
计算得： $\alpha = (K + \lambda I)^{-1} y$

4. 小结

应对场景，选用不同得 $k(.,.)$ ，可以在训练集上计算好 $K, \alpha$ ，就可以构建如下核化的线性模型：
$\hat{y} = w^{T}\phi(x) = \sum_{i=1}^{N} \alpha_{n} \phi(X_{i})^{T} \phi(x) = \sum_{i=1}^{N} \alpha_{n} k(X_i, x)$
其中 $X_{i}$ 为第 $i$ 个训练样本， $(x, \hat{y})$ 为测试的输入输出对。

5. ....

线性回归中引入核方法
2019-04-09 1. 线性回归 (L2-norm) 目标函数：最优解： 2. 非线性 && 拉伸函数拟合目...
SVM、核方法、SVR基本原理介绍
支持向量线性超平面求解方法 1.引入SVM基本型核方法（求解非线性可分问题） 1.核函数软间隔 1.软间隔 ...
tensorflow入门应用方法(二)——全连接深度网络搭建
前一篇文章tensorflow入门应用方法——线性回归和逻辑回归中，主要阐述了应用tensorflow搭建线性回归...
使用SVM支持向量机解决分类问题
导入模块数据，绘制散点图创建支持向量机绘制决策边界引入核函数由2D映射至3D 高斯核函数及非线性决策边界 ...
说说梯度下降
梯度下降算法是很多机器学习算法会采用的一个解决最小化问题的方法。比如线性回归中，我们定义了一个线性的假设函数，现在...
09-支持向量机（四）线性不可分支持向量机与核函数
1、核函数的引入上一节我们讲到线性不可分的低维特征数据，我们可以将其映射到高维，就能线性可分。现在我们将它运用到...
SVM支持向量机（三）
非线性支持向量机与核函数对解线性分类问题，线性分类支持向量机是一种非常有效的方法。但是有些分类问题的非线性的。其...
相关系数与回归系数
在一元线性回归中，自变量的标准回归系数与自变量和因变量之间的相关系数是一样的。但在多元线性回归中，由于自变量间通常...
02 SVM - 拉格朗日乘子法
01 SVM - 概述自变量无约束的求极值方法 - 梯度下降法 10 回归算法 - 梯度下降在线性回归中的应用1...
统计基础27：饱和模型与偏差计算R方与p值
引言：logistic回归中，我们了解到R2和P值的计算方法。但josh starmer老师指出，广义线性模型中R...