模型误差=偏差+方差+数据本身误差
偏差:度量了学习算法的期望预测与真实结果的偏离程度,既刻画了算法本身的拟合能力。比如:射击打靶,表示偏离靶心的差距。
方差:度量了同样大小的训练集的变动所导致的学习性能变化,既刻画了数据扰动所造成的影响。比如:射击打靶,表示多次射击的聚散程度。
偏差:实际也可称为避免欠拟合,欠拟合导致在训练集不好,测试集也不好。
解决方法:寻找更好的特征;用更多的特征。
方差:避免过度拟合,在训练集会好,但测试集会不好。
解决方法:增加数据集合-使用更多的数据集,噪声点比减少;减少数据特征-减少数据维度,高维空间密度小;正则化法;交叉验证法。
网友评论