Stratified K-fold 是 K-fold 的一个变体, 用于比例严重失调的的样本。 Stratified k-fold 可以保证每次抽取的样本中,包含各个类型的样本比例一致。 比如:
要训练一个模型,根据一组指标预测病人是否患有某种疾病。 但是在样本中, 患病的比例只有 5%, 也就是说有
95% 的 Negateive 而只有 5% 的 Positive。 这时如果用 Stratified k-fold , 就可以保证每次抽取的样本中, 都有大约5%的Positive样本。 否则, 因为Positive比例太小, 很容易造成每次抽取中包含的阳性样本比例波动过大。
网友评论