美文网首页
交叉验证

交叉验证

作者: 土豆有点 | 来源:发表于2017-11-06 18:50 被阅读28次

    为什么使用交叉验证?

    在许多实际应用中数据是不充足的。交叉验证的基本思想:重复的使用数据。把给定的数据进行切分,将切分的数据组合为训练数据与测试数据。

    交叉验证常用的方法

    1. 简单交叉验证
      我们可以把整个数据集分成两部分,一部分用于训练,一部分用于验证,这也就是我们经常提到的训练集(training set)和测试集(test set)。


    该方法只用了部分数据进行模型的训练

    我们都知道,当用于模型训练的数据量越大时,训练出来的模型通常效果会越好。所以训练集和测试集的划分意味着我们无法充分利用我们手头已有的数据,所以得到的模型效果也会受到一定的影响。

    2.交叉验证
    随机地将已经给的数据切分为s个互不相交大小相同的子集;然后利用S-1个子集的数据训练模型,利用余下的子集测试模型;将这一过程对可能的S种选择重复进行。


    相关文章

      网友评论

          本文标题:交叉验证

          本文链接:https://www.haomeiwen.com/subject/nltrmxtx.html