ML：使用线性回归实现多项式拟合

作者: ACphart | 来源:发表于2018-09-05 14:54 被阅读130次

ML：使用线性回归实现多项式拟合
python与机器学习回归：房价与房屋尺寸关系的线性拟合、多项式
统计学习基础复习浓缩版
机器学习系列（二十三）——过拟合overfitting和欠拟合u
回归与内差
从回归到临床模型（一）
python实现多元线性拟合、一元多项式拟合、多元多项式拟合
2020-08-30--多项式回归01
Polynomial regression（多项式回归）
Python | 多项式回归的实现

介绍

注意：这里的代码都是在Jupyter Notebook中运行，原始的.ipynb文件可以在我的GitHub主页上下载 https://github.com/acphart/Hand_on_ML_Algorithm 其中的LinearRegression_multi_polynomal.ipynb，直接在Jupyter Notebook中打开运行即可，里面还有其他的机器学习算法实现，喜欢可以顺便给个star哦 ~~~

描述

这里我们用线性回归实现多项式拟合，这样就可以实现简单的非线性拟合了
注：这里没有考虑性能上的优化，如特征的归一化，读者可自行试验 ~~

import numpy as np
import matplotlib.pyplot as plt
from IPython.core.interactiveshell import InteractiveShell

InteractiveShell.ast_node_interactivity = 'all'

模拟数据

模拟数据的内在模式是： $y = x^2$ , 通过加入随机噪声即得到模拟数据

np.random.seed(20180824)
m = 200

x = np.linspace(-3, 3, m).reshape(m,1)
y = x**2 + np.random.randn(m,1)

_ = plt.scatter(x, y)
_ = plt.plot(x, x**2, 'Black')

损失函数和梯度函数

这是实现的主要工作，定义我们的损失函数和梯度函数
损失函数是 $Loss(\theta, X) = \frac{1}{2m}\sum_{i = 1}^m[h_\theta(x^{(i)}) - y^{(i)}]^2$
梯度函数是 $\frac{\partial}{\partial \theta_j} Loss(\theta, X) = \frac{1}{m}\sum_{i = 1}^m[h_\theta(x^{(i)}) - y^{(i)}]x_j^{(i)}$
这里基本的优化就是把循环求和操作向量化：
$Loss(\theta, X) = \frac{1}{2m}[h_\theta(X) - y]^T[h_\theta(X) - y]$
$\nabla Loss(\theta, X) = \frac{1}{m}X^T[h_\theta(X) - y]$

def loss_func(X, y, theta):
    loss = np.dot(X, theta) - y
    ridge = np.dot(theta, theta)
    return 1./(2*m) * np.dot(loss.T, loss) + ridge

def grad_func(X, y, theta):
    loss = np.dot(X, theta) - y
    return 1./m * np.dot(X.T, loss) + 2*theta

生成多项式特征矩阵

这一部分就是实现非线性拟合的关键，这里我们通过不同的最高次幂可以得到不同的多项式特征矩阵
例如，当 $n = 2,\quad x = (x_1, x_2, ..., x_m)^T$ 时
我们可以得到多项式特征矩阵：
$\left [ \begin{array}{c c c} 1 & x_1 & x_1^2 \\ 1 & x_2 & x_2^2 \\ \vdots & \vdots & \vdots \\ 1 & x_m & x_m^2 \end{array} \right ]$

def X_poly(x, n):
    tx = x
    X = np.ones((m, n+1))
    for i in range(1, n+1):
        X[:,i] = tx.reshape(m)
        tx = tx*x
    return X

训练算法

这里我们设置训练相关的参数，同时初始化参数向量和生成特征矩阵
这里我们设置最高次幂为2，则我们的假设函数为： $h_\theta(x) = \theta_0 + \theta_1 x + \theta_2 x^2$
然后进行迭代训练，同时可视化训练过程：迭代次数越多的拟合曲线红色越深，黑色曲线代表数据的内在模式
我们能看到，随着迭代加深，我们训练出来的曲线与内在模式越来越拟合

np.random.seed(20180824)

n = 2
alpha = 0.01
accuracy = 1e-6

i = 1
index = 1
c = np.array([0.8, 0.8, 0.8])

X = X_poly(x, n)
theta = np.random.randn(n+1, 1)
grad = grad_func(X, y, theta)

while not np.all(abs(grad) <= accuracy):
    theta = theta - alpha*grad
    grad = grad_func(X, y, theta)
    i = i+1
#     if i > 1e3:
#         break
    if i%index == 0:
        _ = plt.plot(x, np.dot(X, theta), color=c)
        index = index*2
        c = c - [0., 0.1, 0.1]

_ = plt.scatter(x, y, alpha=0.5, color='b')
_ = plt.ylim(-2, 10)
_ = plt.plot(x, x**2, 'Black', lw=2)
# print(" t0: {0[0]:.4f} \n t1: {0[1]:.4f} \n t2: {0[2]:.4f}".format(theta.ravel()))

ML：使用线性回归实现多项式拟合
介绍注意：这里的代码都是在Jupyter Notebook中运行，原始的.ipynb文件可以在我的GitHub主...
python与机器学习回归：房价与房屋尺寸关系的线性拟合、多项式
房价与房屋尺寸关系的线性拟合多项式回归岭回归
统计学习基础复习浓缩版
1.简单线性回归 2.多元线性回归 3.多项式回归 4.广义线性回归(含逻辑斯谛回归）广义线性回归模型通过拟合响...
机器学习系列（二十三）——过拟合overfitting和欠拟合u
过拟合和欠拟合有了多项式回归的方式，我们就可以对非线性的数据做拟合了，不过，复杂度不够的多项式回归会导致欠拟合问...
回归与内差
多项式曲线拟合（线性回归拟合） polyfit函数拟合一次函数实例代码：散点图和线性相关系数 scatter(...
从回归到临床模型（一）
一.回归基础知识二.线性回归 1.拟合线性模型 2.简单线性模型 3.多项式回归 4.多元线性回归 5.回归诊断...
python实现多元线性拟合、一元多项式拟合、多元多项式拟合
数据分析中经常会使用到数据拟合，本文中将阐述如何实现一元以及多元的线性拟合以及多项式拟合，本文中只涉及实现方式，不...
2020-08-30--多项式回归01
主要内容什么是多项式回归 scikit-learn中的多项式回归和Pipeline 过拟合和欠拟合为什么要使用...
Polynomial regression（多项式回归）
多项式回归不是线性的，为了升维考虑的维度多了，可以更好的拟合数据本质：多项式回归不是一个新的回归算法，只是特...
Python | 多项式回归的实现
多项式回归是一种线性回归形式，其中自变量x和因变量y之间的关系被建模为n次多项式。多项式回归拟合x的值与y的相...