假如一个数据集,正负样本比例为1:100
训练的模型倾向于所有的例子判为负例
因为要保证整体的损失最小
解决办法:
重采样:
对多的欠采样:
对少的重采样:数据有重复
人工生成样本
使用对样本数量干扰少的算法(DT)
本文标题:样本不均衡
本文链接:https://www.haomeiwen.com/subject/yhzifqtx.html
网友评论