想必都清楚为什么存在训练集和测试集.所以下面就是关于验证集存在的理由.
以线性回归为例(关于theta,lambda这些参数的含义参照Ng的视频):
通过训练集得到的theta值符合代价函数的最小值,但是这很可能存在过拟合的情况,所以这个时候就需要类似于lambda参数进行正则化,那么lambda参数就需要一个一个去试,比如说1,2,4,8,16...试了之后呢,怎么评判哪个lambda好,哪个不好呢,这个时候就需要验证集了.
总而言之,就是将theta和lambda等参数一组一组带入训练集中训练,得到结果交给验证集,由验证集得到最好的参数是哪一组,最后再交给测试集测试.
网友评论