机器学习入门基础之模型篇-----回归

作者: Amanda_569b | 来源:发表于2018-01-24 07:05 被阅读12次

分类,打分,排名和概率预测这些机器学习研究的标签空间是离散的类集合。 但是函数估计器,也叫做回归(regression),是研究真的价值目标变量,是映射 f:x--R, 也可以表示成 (xi, f(xi)),是研究输出预测连续的数值。回归一般用多项式来表示回归函数,多项式的次数越多就越容易过拟合,所以应该选取简单的多项式。毕竟回归研究的是整体数据的趋势,不是要把所有的数据都预测准确。数据一般会有噪音,也就是不准确的信息。

图一

图一可以看出,红线是直线,是一次多项式, 基本把数据趋势描述出来了。黄线是二次多项式也描述出了数据趋势。 蓝线次数最高,几乎把所有点都包含在输出结果上,这样在训练集合上拟合过于完美,很可能在测试集合 (新数据)上会可能造成输出错误的结果,这叫做过拟合。我们可以从模型的参数个数来判断是否是过拟合问题。有个原则是为了避免过拟合。参数的数量要少于数据点的个数。 n次多项式有 n+1 个参数, 比如直线 y=ax+b有两个参数。再如上图有五个点,参数要少于5。用直线最简单,最好。

回归有很多应用,比如典型的根据房屋的地理,大小等条件来预测房屋的价格。通过训练集得到线性模型,也就是多项式,再用这个多项式来预测测试集。所以,如果数据集合和要研究的问题符合线性回归,我们就应该尽量选择简单的多项式来表达这个趋势。

相关文章

  • 2019-10-29

    Day2 简单线性回归模型 机器学习入门--简单线性回归机器学习算法之线性回归算法 导入库matplotlib 绘...

  • 机器学习入门基础之模型篇-----回归

    分类,打分,排名和概率预测这些机器学习研究的标签空间是离散的类集合。 但是函数估计器,也叫做回归(regressi...

  • 逻辑回归

    机器学习基础(2):逻辑回归 为什么是逻辑回归? 上一篇文章我们说了线性回归模型,这一篇我们讲一讲逻辑回归。读到这...

  • 机器学习入门——实战篇之强化学习

    这是本篇文章是《机器学习入门》系列文章的第五篇,该系列有如下文章:《机器学习入门——基础篇》《机器学习入门——实战...

  • 机器学习入门——实战篇之非监督学习

    这是本篇文章是《机器学习入门》系列文章的第三篇,该系列有如下文章:《机器学习入门——基础篇》《机器学习入门——实战...

  • 机器学习入门——实战篇之深度学习

    这是本篇文章是《机器学习入门》系列文章的第四篇,该系列有如下文章:《机器学习入门——基础篇》《机器学习入门——实战...

  • 机器学习入门——实战篇之监督学习

    这是本篇文章是《机器学习入门》系列文章的第二篇,该系列有如下文章:《机器学习入门——基础篇》《机器学习入门——实战...

  • 机器学习入门——基础

    这是本篇文章是《机器学习入门》系列文章的第一篇,该系列有如下文章:《机器学习入门——基础篇》《机器学习入门——实战...

  • [回归] 线性回归 Linear Regression

    线性回归是统计/机器学习中最基础的一个模型,在线性回归的基础上可以拓展出之后相当多的模型,例如逻辑回归。 线性回归...

  • sigmoid function为什么是1/{1+exp(-z)

    逻辑回归模型背景 逻辑回归模型是机器学习中最常见的一种基础模型,模型为:f_w,b(x)=\sigma(\sum_...

网友评论

    本文标题:机器学习入门基础之模型篇-----回归

    本文链接:https://www.haomeiwen.com/subject/qxsyaxtx.html