美文网首页Python语言与信息数据获取和机器学习
机器学习02:了解线性回归的原理

机器学习02:了解线性回归的原理

作者: chardlau | 来源:发表于2018-02-27 16:47 被阅读14次

本文来自同步博客

P.S. 不知道简书怎么显示数学公式。所以如果觉得文章下面格式乱的话请自行跳转到上述链接。后续我将不再对数学公式进行截图,毕竟行内公式截图的话排版会很乱。看原博客地址会有更好的体验。

上一篇文章介绍如何使用sklearn进行线性回归预测。接下来本文将深入原理,了解线性回归是如何工作的。

基础概念

线性回归为何叫线性?实际上,像在处理Google的股票统计数据时,我们使用线性回归是在这堆数据所在的N维空间中找到一条线来描述这些数据的规律,因此才叫线性回归。这个过程称为拟合,这条线成为拟合线。

这条拟合线上的某个数据点或多或少都会偏离实际统计的值。实际统计数据和拟合线对应数据的差叫残差。很明显,残差可以反映模型的预测误差。

但是残差有正有负的,不方便计算。而且实际运用中我们不需要关注残差的正负,因为正负并不能描述误差的大小程度。为了降低计算复杂性,我们使用这个差值的平方进行计算。你可能会想到,差值的平方不是把差值给改了吗,没关系吗?答案是:数据确实变了,但没影响。因为我们真正使用的是残差的绝对值,用它描述误差大小的程度,而对这个绝对值进行平方后有同样的效果,毕竟y = |x| 与y = x^2有同样的单调性。

结合上述平方的想法,为了让预测更加准确,我们应该选择一条线,能够使得线上每个点与实际数据的残差平方的总和最小。这样的线才能叫最佳拟合线。

构建模型

接下来就是利用统计数据和上述原理来构建模型,也就是找最佳拟合线。

二维空间中,直线可以表示为:

直线

我们已经有通过统计得到的很多份数据Xi和Yi,接下来的目标就是利用这些数据求解参数a和b。

求解过程暂时不展开,请参考这个讲述求解参数的文章。最终得到的结果如下图所示:

b a

至此即可得到最佳拟合线的参数,代回直线方程中就可以作为预测模型,可用于对新的X进行计算从而预测出对应的Y。其中,


X

表示X的平均值。


Y

同理。

上述的这种方法称为最小二乘法(Least Squares)。扩展到N维空间,最小二乘法依旧可用,不过我怕陷入数学的漩涡暂时不敢继续深入。除此之外,在线性回归中求解参数的方法还有“梯度下降法(Gradient Descent)”。

R方理论评估模型

在前一篇文章中提到了模型的准确性accuracy一词。实际上accuracy在统计学中应该称为“可决系数”,它的计算方法有两种。在这里我尝试介绍R方理论作为计算方法。

R方的计算方法如下:

R方的计算方法

这个式子用1减去y的残差平方和与y的总方差的比值,y减去widehat{y}也就是残差,是拟合方程中对数据尚不能解释到的部分,用1减去不能解释的部分,那么剩下的就是可以解释的部分。也就是说自变量解释了因变量变动的百分比的多少,那么R^2 的值肯定是越大越好,意味着该模型把y的变动解释得好,R^2的范围显然是0到1。

相关文章

  • 线性回归--原理

    线性回归--原理 线性回归--python实现(不使用框架) 线性回归--sklearn框架实现 通常我们学习机器...

  • 机器学习02:了解线性回归的原理

    本文来自同步博客。 P.S. 不知道简书怎么显示数学公式。所以如果觉得文章下面格式乱的话请自行跳转到上述链接。后续...

  • 3.1.1.1 线性模型

    线性模型 (Linear Model) : 原理 《机器学习》周志华 3.1 线性回归 最小均方误差(square...

  • Task4模型调参

    学习目标 了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程 内容介绍 线性回归模型:线性回归对于特征的要...

  • 线性回归

    线性回归是机器学习中最基础最简单的回归算法了,现在关于线性回归的原理做一个总结。 关于线性的概念,其实在高中就有了...

  • 2 逻辑回归

    逻辑回归是线性回归的变形,看了很多机器学习书籍,吴恩达的课程对线性回归和逻辑回归的讲解非常清晰,原理性和推导都很好...

  • Python编写线性回归算法

    Python编写线性回归算法 前言 线性回归(Linear Regression)是机器学习的基础,作为机器学习算...

  • 2019-10-29

    Day2 简单线性回归模型 机器学习入门--简单线性回归机器学习算法之线性回归算法 导入库matplotlib 绘...

  • TensorFlow工具快速入门教程8线性回归简介

    线性回归 本章介绍一般的线性回归和机器学习的基本原理。 TensorFlow提供了完全控制计算的工具。 这是通过低...

  • 为什么我们要使用LU或者QR计算线性回归参数而不是用逆矩阵?

    线性回归是最基本的机器学习模型,我们通过学习机器学习中本文假设你对线性回归和矩阵论有一定的了解,我们探索两种通过矩...

网友评论

    本文标题:机器学习02:了解线性回归的原理

    本文链接:https://www.haomeiwen.com/subject/zismxftx.html