数据集里如果有缺失值,最简单的处理办法就是给他删掉,但是这样有一个弊端就是减少了数据量,另外还有选择就是对缺失值进行填充,填充的时候有几种常用的选择,数值型变量可以选择用平均值或者中位数来填充,分类变量可以选择用频数出现最多的来填充等等
https://www.analyticsvidhya.com/blog/2016/03/tutorial-powerful-packages-imputing-missing-values/
https://www.rpubs.com/justjooz/miss_data
Caret包的电子文档
https://topepo.github.io/caret/index.html
caret包的小例子
http://www.rebeccabarter.com/blog/2017-11-17-caret_tutorial/
机器学习的简单小例子
http://www.rebeccabarter.com/blog/2020-03-25_machine_learning/
R语言里机器学习
https://lgatto.github.io/IntroMachineLearningWithR/index.html
清华大学鲁老师组的学习资料
https://lulab1.gitbook.io/training/
网友评论