美文网首页
机器学习day5

机器学习day5

作者: rivrui | 来源:发表于2020-05-31 15:09 被阅读0次

超参数调优

超参数对模型至关重要。

网格搜索

网格搜索应该是最简单的超参数搜索算法。采用较大的搜索范围和较小的步长。十分耗费计算资源和时间。一般是先设置较大的搜索范围和较大的步长,来寻找全局最优值的可能位置,然后缩小搜索范围得我步长和范围,但是如果目标函数非凸,可能错过全局最优值。

随机搜索

在搜索范围随机抽样,样本足够大,也有很大的概率找到全局最优值,当然,结果没法保证。

贝叶斯优化算法

贝叶斯算法会记录测试过的值,学习目标函数的形状,找到全局最优值提升的参数。
贝叶斯算法,先根据先验分布,假设一个搜索函数,然后每一次使用采样的点测试目标函数时,利用这个信息来更新目标函数的先验分布,最后,算法测试根据后验分布找到全局最值的最大的可能性的点。
贝叶斯算法如果找到了局部最优解,则会在该区域不断地采样,很容易陷入局部最优值。

过拟合和欠拟合

过拟合指模型对于训练数据拟合过当,反应出来就是训练集评价指标表现很好,但是在测试卷或者新数据上面表现一塌糊涂,评价指标明显差于训练集。
欠拟合则是,模型在训练集和预测时表现都不好。

示意图
欠拟合无法捕捉数据的特征,过拟合则是模型复杂,把噪声也学习到了模型中,导致模型泛化能力差。

降低过拟合的风险的办法

  1. 获取更多的数据。这是最直接有效的方法,更多的数据能够学习有效的特征,降低噪声的影响。如果找不到多的训练数据,可以自己尝试扩充训练数据。
  2. 降低模型复杂度。数据较少,模型又复杂是产生过拟合的主要因素。比如神经网络中降低网络层数,神经元个数。决策树降低树的深度,进行剪枝。
  3. 正则化方法。给模型的参数机上一定的正则约束,比如将权值得大小加入到损失函数中。以L2为例:
    C=C_{0}+\frac{\lambda}{2n}.\sum_{i}w_{i}^{2}
  4. 集成学习方法。把多模型集成在一起,降低单一模型过拟合的风险,比如Bagging方法。

降低欠拟合风险的方法

  1. 添加新的特征。如因子分解机、梯度提升决 策树、Deep-crossing等都可以用来丰富特征。
  2. 增加模型的复杂度,提高拟合能力。在线性模型中添加高次项,在神经网络模型中增加网络层数或 神经元个数等。
  3. 减小正则化系数。正则化是用来防止过拟合的,但当模型出现欠拟合现象时,则 需要有针对性地减小正则化系数。

相关文章

  • 机器学习day5

    超参数调优 超参数对模型至关重要。 网格搜索 网格搜索应该是最简单的超参数搜索算法。采用较大的搜索范围和较小的步长...

  • 机器学习概述与算法介绍(二)

    机器学习概述 机器学习基本概念 机器学习基本流程与工作环节 机器学习中的评估指标 机器学习算法一览 3. 机器学习...

  • Day5如何提高选书能力

    DAY5 学习课程:《Day5 :如何建立产品感,提高书籍选品能力,从新出版的书籍里挑出高价值读物》 今日作业:预...

  • 「零基础」python机器学习入门(一)| 什么是机器学习?

    了解什么是机器学习?为什么需要机器学习? 一、什么是机器学习? 字面上,「机器学习」可以拆分为两个词:机器、学习。...

  • Python3 机器学习简明教程

    1 机器学习介绍    1.1 什么是机器学习    1.2 机器学习的应用    1.3 机器学习基本流程与工作...

  • 什么是深度学习

    1.1 人工智能、机器学习与深度学习 人工智能 > 机器学习 > 深度学习 即,人工智能包括机器学习,机器学习包括...

  • 机器学习

    1、人工智能->机器学习->深度学习 注:->包含关系 2、机器学习领域: 模式识别=机器学习 数据挖掘=机器学习...

  • 机器学习,机器“学习”

    如果你渴望奇迹,那么机器学习对你来说是一场精神盛宴。我诚挚的邀请你一同前往。 我为什么总是要读这些人工智能、机器学...

  • 2019-02-17

    机器学习系列 机器学习100天 机器学习第1天:数据预处理 机器学习第2天:简单线性回归模型 机器学习第3天:多元...

  • 机器学习实战之准备(一)

    目录 机器学习简单概述 机器学习的主要任务 学习机器学习的原因 python语言优势 1.1 何谓机器学习 简单的...

网友评论

      本文标题:机器学习day5

      本文链接:https://www.haomeiwen.com/subject/ncelzhtx.html