美文网首页风控
模型评估与模型选择

模型评估与模型选择

作者: 云之彼端09 | 来源:发表于2018-10-27 13:39 被阅读2次
thinking: 统计学习,我们建立模型的目的是为了对未知事情的预测,
然而这个本身就是对未知事情的预测,我们怎么去评判这个模型(学习方法)
的好坏呢,反过来想,如果做一件事情做的好,我们可以通过失误率来判断
做事情的好坏,还可以通过考试成绩的高低来作为判断的依据。
那么对于学习方法(模型)的评估就有了训练误差和测试误差两个标准,
当然误差越低就说明越好

训练误差是模型Y=f(x)关于训练数据集的平均损失


测试误差是模型Y=f(x)关于测试数据集的平均损失


损失函数为 0-1 函数的时候,测试误差就成了误差率


I为指示函数 不相等的时候为1 否则为0 测试数据集的准确率为


测试误差小的方法具有更好的预测能力

过拟合与模型选择

注意:如果一味的追求提高数据的预测能力,选择的模型就会比真的模型复杂。
这种现象称为过拟合,过拟合也就是模型的参数过多,
这样会出现对已知数据的预测很好,对未知数据的预测很差。

一个例子说明 参数个数(模型复杂度) 和 预测误差的关系
10个数据点,用0~9次多项式函数对数据进行拟合

数据集
假定数据由M次多项式生成,选择最有可能产生这样数据的多项式



多项式的系数也就是模型的复杂度 经验最小化策略,求解参数,即多项式系数



对wj求偏导 求的拟合多项式系数


M=0,M=1,M=3,M=9的拟合图形


结论:M=1 多项式曲线是一条直线,数据拟合效果很差,M=9,多项式曲线通过每一个数据点,训练误差为0

训练误差和测试误差与模型复杂度的关系
测试误差和训练误差跟模型复杂度的关系
为了使预测模式更好就要选择 测试误差最小的模型
那么怎么选择测试误差模型最小呢
常用的模型选择方法:
        正则化和交叉验证

相关文章

  • 西瓜书-模型评估与选择

    模型评估与选择 西瓜书第一章,模型评估与选择.

  • 模型评估与模型选择

    训练误差是模型Y=f(x)关于训练数据集的平均损失 测试误差是模型Y=f(x)关于测试数据集的平均损失 损失函数为...

  • 统计学习方法1.4-2.1 笔记

    1.4 模型评估与模型选择 训练误差与测试误差 关于模型的拟合好坏,计算训练集的训练误差进行衡量。关于模型预测的好...

  • 模型评估与选择

    模型的选择 误差 误差:(Error): 是模型的预测输出值与其真实值之间的差异 训练(Training): 通过...

  • 模型评估与选择

    泛化误差:学习器在新样本上的误差为泛化误差。显然,我们希望得到泛化误差小的学习器。 过拟合:学习器把训练样本学得‘...

  • 模型评估与选择

    一、偏差与方差 设测试样本为,为在数据集中的标签,为的真实标签,为训练集上学习得到的模型,为在上的预测输出。 期望...

  • 模型评估与选择

    过拟合:严重影响泛化能力。过拟合即对训练样本的训练效果太好,导致将训练样本自身特点当成样本都具有的特征,导致泛化能...

  • 模型评估与选择

    1. 数据集划分 1.1 留出法(hold - out):直接将数据集D划分成两个互斥的集合,训练集S、测试集T,...

  • 统计学习方法概论

    统计学习方法概论 统计学习 监督学习 统计学习三要素 模型评估与模型选择 泛化能力 生成模型与判别模型 分类问题 ...

  • 【百面机器学习-模型评估】

    为什么需要模型评估? 在计算机科学特征时机器学习领域中,对模型的评估至关重要。只有选择与问题相匹配的评估方法...

网友评论

    本文标题:模型评估与模型选择

    本文链接:https://www.haomeiwen.com/subject/vjhdtqtx.html