美文网首页
初识R语言—统计篇之常用的两种抽样方法

初识R语言—统计篇之常用的两种抽样方法

作者: 超级无敌大蜗牛 | 来源:发表于2020-04-03 13:22 被阅读0次
#导入数据
data <- read.csv("data.csv")
data <- data[order(data$major,data$ID),] #排序,让data好看一些而已

1.随机抽样

sample(x,size,replace = F)
replace=F是默认的,表示不放回抽样

#1.对数据集的序号进行抽样
index <- sample(1:nrow(data),60,replace = F) #1:nrow(data),从第一行到最后一行,抽取60个;
#2.根据序号提取数据集中的相应数据,即可得到样本数据
sampledata <- data[index,]

2.分层抽样

sampling包中的strata(data,stratanames=,size,method=)

#1.通过strata得到抽样序号
strata_data <- strata(data,stratanames = "major",size = c(20,40,60),method = "srswor")#srswor表示不放回抽样
#2.根据序号提取数据集中的相应数据,即可得到样本数据
sampledata2 <- data[strata_data$ID_unit,]

相关文章

网友评论

      本文标题:初识R语言—统计篇之常用的两种抽样方法

      本文链接:https://www.haomeiwen.com/subject/rkdhphtx.html