![](https://img.haomeiwen.com/i12535349/cbbe59743945aba5.png)
![](https://img.haomeiwen.com/i12535349/e734d3304f6fddb2.png)
![](https://img.haomeiwen.com/i12535349/31c7edbb95d9c577.png)
类别不平衡问题
.现有技术大体上有三类做法:
第一类是直接对训练集里的反类样例进行"欠采样" (undersampling) ,即去除一些反倒使得正、反例数日接近7 然后再进行学习;第二类是对训练集里的正类样例进行"过来样" (oversampling) ,即增加一些正例使得正、反例数目接近,然后再进行学习;第三类则是直接基于原始训练集进行学习,但在用训练好的分类器进行预测时,将式(3.48)嵌入到其决策过程中,称为"阔值移动" (threshold-moving).
实战部分machine_learning/Logistic at master · HELLOTREE1/machine_learning · GitHub
网友评论