机器学习系列（三十四）——支撑向量回归（SVR）

作者: Ice_spring | 来源:发表于2019-07-29 23:43 被阅读20次

机器学习系列（三十四）——支撑向量回归（SVR）
多分类SVM
支持向量机
16.gitchat训练营-SVR——一种“宽容”的回归模型
多分类SVM
18、SVM（支持向量机）
用对偶法求解 SVR
SVR 支持向量回归
SVM算法的实现
SVR（Support Vactor Regerssion）支持

本篇主要内容：SVR

SVM解决回归问题

前面我们说过SVM不只可以解决分类问题，也可以解决回归问题，现在就简要叙述下SVM如何解决回归问题。
所谓回归问题其实就是找到一条拟合曲线，使得预测输出能与真值尽可能地接近，同时面对未知数据又要有很好的泛化能力。在线性回归中我们是让MSE的值达到最小，与线性回归不同，支撑向量机回归（Support Vector Regression，下简称SVR）能容忍模型输出与真实值最多有 $\epsilon$ 的误差，只有模型输出与真实值的误差超过 $\epsilon$ 时才去计算损失值。如图所示，这相当于以回归直线为中心，构建了一个宽度为 $2\epsilon$ 的间隔带，只要训练样本落入此间则认为预测是准确的，否则才去计算损失值。

SVR原理

于是可以定义损失函数:
$loss=\frac{1}{2}||w||^2+C\sum_{i=1}^{m}l_{\epsilon}(f(x_i)-y_i)$

其中C是正则化常数， $l_{\epsilon}$ 是 $\epsilon$ -不敏感损失函数。最终SVR问题又被转化为数学上的一个最优化问题（该最优化问题的求解自行翻阅机器学习教材），通过指定超参数C和 $\epsilon$ 求解该模型，即可得到回归方程。SVR不只可以进行线性回归，通过核函数的作用，SVR同样能解决非线性回归。
下面在模拟数据集上使用SVR进行回归，宏观感受一下SVR的效果：

import numpy as np
import matplotlib.pyplot as plt
x = np.random.uniform(-3,3,size=100)
X = x.reshape(-1,1)
y = 0.5 * x**2 +x +2 +np.random.normal(0,1,size=100)
plt.scatter(x,y)
plt.show()

数据集

这个数据集符合的真实回归曲线是 $y=0.5x^2+x+2$ ，加入了一定的标准Gauss噪音。
首先使用线性SVR进行回归，为线性SVR过程创建Pipeline：

def StandardLinearSVR(epsilon=0.1):
    return Pipeline([
        ('std_scaler',StandardScaler())
        ,('linearSVC',LinearSVR(epsilon=epsilon))
    ])

训练一个线性SVR并绘制出回归曲线：

svr = LinearSVR()
svr.fit(X,y)
y_predict = svr.predict(X)
plt.scatter(x,y)
plt.plot(np.sort(x),y_predict[np.argsort(x)],color='r')#有序排序后绘制曲线
plt.show()

回归曲线和R方值：

线性SVR

R方

由回归曲线和R方值可见线性SVR在这个数据集上的效果一般，虽然有一定的线性关系，但是线性关系不强烈。因为模拟数据实际符合的是二次曲线。下面换用带核函数的SVR进行该回归任务。首先修改Pipeline：

def StandardSVR(epsilon=0.1,degree=3,C=1.0):
    return Pipeline([
        ('std_scaler',StandardScaler())
        ,('SVC',SVR(kernel='poly',degree=degree,C=C))
    ])

训练一个带多项式核函数的SVR并绘制回归曲线：

'''使用非线性SVR'''
svr2 = SVR(degree=2)
svr2.fit(X,y)
y_predict2 = svr2.predict(X)
plt.scatter(x,y)
plt.plot(np.sort(x),y_predict2[np.argsort(x)],color='r')#有序排序后绘制曲线
plt.show()

poly_d2

R方

此时回归曲线已经和真实的趋势非常接近，而且R方值相比于线性SVR要优秀许多。实际中还是要进行多次参数调节，可以通过网格搜索方式来寻找最优模型。

机器学习系列（三十四）——支撑向量回归（SVR）
本篇主要内容：SVR SVM解决回归问题前面我们说过SVM不只可以解决分类问题，也可以解决回归问题，现在就简要叙...
多分类SVM
支持向量回归SVR SVR https://zhuanlan.zhihu.com/p/47895420 https...
支持向量机
支持向量机(SVMs)是一组用于回归、分类和异常值检测的监督学习方法。支持向量回归（SVR）支持向量分类的方法...
16.gitchat训练营-SVR——一种“宽容”的回归模型
1.宽容的支持向量回归（SVR）一种“宽容的”回归模型：支持向量回归（Support Vector Regres...
多分类SVM
支持向量回归SVR https://zhuanlan.zhihu.com/p/47895420 https://z...
18、SVM（支持向量机）
一、支持向量机SVM（support vector machine） SVC分类，SVR回归--统称SVM 支持向...
用对偶法求解 SVR
支持向量回归（Support Vector Regression，SVR）是一种有“宽容度”的回归模型，即它...
SVR 支持向量回归
怎么使用个体输入，求出mean已知的总体中各个个体的百分比？先从SVM开始讲起。前两行均为线性模型，其中 - ...
SVM算法的实现
一、简介 SVM；名为支持向量机，其中支持向量机有两种用途，用于分类即SVC，用于回归SVR 我们可以从SKLEA...
SVR（Support Vactor Regerssion）支持
支持向量机(SVM)本身是针对二分类问题提出的，而SVR（支持向量回归）是SVM（支持向量机）中的一个重要的应用分...