随机抽样又分为重复随机抽样和不重复随机抽样两种。重复抽样是指:本次从整体中抽取出的数据样本,在下一次抽取时同样有机会被抽取。不重复抽样就是:一旦被抽取为样本,下次就不能再被抽取了。
sample函数可以完成随机抽样处理,其基本形式为:
sample(x, size, replace = FALSE)
具体参数说明:
x 整体数据,以向量形式给出
size 抽取样本的数目
replace 如果为F(默认),则是不重复抽样,此时size不能大于x的长度;
如果为T,则是重复抽样,此时size允许大于x的长度
prob 抽样向量中元素被抽到的可能性
相应的示例代码如下:
sample(c(1:20),size=10) #在1~20数据中不重复地随机抽取10个元素作为样本
[1] 13 7 4 5 2 19 14 6 10 3
sample(c(1:20),size=30,replace=T) #重复地随机抽取30个元素作为样本
[1] 7 11 2 11 7 3 1 13 12 4 19 11 16 4 18 13 13 5 17 11 3 15 17 5 1
[26] 15 5 12 10 10
网友评论