sample函数在机器学习中的作用比较大,因为它可以将数据按7:3或5:5等比例随机的分为训练集和测试集。
image.png
按其官方用法,
![image.png](https://img.haomeiwen.com/i15565422/ea46affc8593cf41.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
X是要取的数据集,size是要取的个数,若size的个数大于X的个数,则replace=T,如果我们要把数据集按7:3的比例划分,则命令如下
ind <- sample(2, n, replace = TRUE,
prob = c(0.7, 0.3))
train <- dat[ind==1, ]
网友评论