随机抽样
按照随机的原则,即保证总体中每一个对象都有已知的、非零的概率被选入作为研究的对象,保证样本的代表性。
随机抽样法就是调查对象总体中每个部分都有同等被抽中的可能,是一种完全依照机会均等的原则进行的抽样调查,被称为是一种“等概率”。随机抽样有四种基本形式,即简单随机抽样、等距抽样、类型抽样和整群抽样。
在R中可以通过函数sample( )来实现.
1) 等可能的不放回的随机抽样:
sample(x, n)
其中x为要抽取的向量, n为样本容量. 例如从52张扑克牌中抽取4张对应
的R命令为:
>sample(1:52, 4)
[1] 3 16 17 15
2) 等可能的有放回的随机抽样:
sample(x, n, replace=TRUE)
其中选项replace=TRUE表示抽样是有放回的, 此选项省略或
为replace=FALSE表示抽样是不放回的. 例如抛一枚均匀的硬币10次
在R中可表示为:
> sample(c("H", "T"), 10, replace=T)
[1] "H" "T" "T" "H" "H" "T" "T" "H" "H" "H"
掷一棵骰子10次可表示为:
> sample(1:6, 10, replace=T)
[1] 4 3 4 5 4 6 2 6 3 4
3) 不等可能的随机抽样:
sample(x, n, replace=TRUE, prob=y)
其中选项prob=y用于指定x中元素出现的概率, 向量y与x等长度. 例如一
名外科医生做手术成功的概率为0.90, 那么他做10次手术
在R中可以表示为:
> sample(c("成功", "失败"), 10, replace=T, prob=c(0.9,0.1))
若以1表示成功, 0表示失败, 则上述命令可变为:
> sample(c(1,0), 10, replace=T, prob=c(0.9,0.1))
[1] 1 1 1 0 1 1 1 1 1 1
排列组合与概率的计算
以扑克牌为例加以说明
从一副完全打乱的52张扑克中取4张, 求以下事件的概率:
- 抽取的4张依次为红心A,方块A,黑桃A和梅花A的概率
- 抽取的4张为红心A,方块A,黑桃A和梅花A的概率
-
抽取的4张是有次序的, 因此使用排列来求解. 所求的事件(记为A)概率为
image.png
R中表示为:
> 1/prod(52:49)
[1] 1.539077e-07
-
抽取的4张是没有次序的, 因此使用组合数来求解. 所求的事件(记为B)概
率为
image.png
即:
image.png
在R中表示为:
> 1/choose(52,4)
[1] 3.693785e-06
网友评论