即:我们的模型是否能在新的数据样本上表现良好?
一般来说,在测试集上表现良好是衡量能否在新数据上表现良好的有用指标:
如果测试集足够大
如果我们不反复使用相同的测试集来做假
以上所有情况基于三项基本假设:
1. 我们从数据集中随机抽取独立同分布的样本;
2. 分布式平稳的:分布不会随时间而产生变化;
3. 我们始终从统一分布中抽取样本:包括训练集、验证集和测试集。
即:我们的模型是否能在新的数据样本上表现良好?
一般来说,在测试集上表现良好是衡量能否在新数据上表现良好的有用指标:
如果测试集足够大
如果我们不反复使用相同的测试集来做假
以上所有情况基于三项基本假设:
1. 我们从数据集中随机抽取独立同分布的样本;
2. 分布式平稳的:分布不会随时间而产生变化;
3. 我们始终从统一分布中抽取样本:包括训练集、验证集和测试集。
本文标题:我们如何得知自己的模型是否出色?·
本文链接:https://www.haomeiwen.com/subject/qszvsqtx.html
网友评论