1. 样本均值分布的理论获取方式
假设总体有N个元素,样本大小为n。则在重复抽样条件下,有N^n种样本,在不重复抽样条件下有种样本。把所有样本的均值都算出来,这些均值的分布,就是样本均值的真实概率分布了。
2. 中心极限定理
假设总体的均值为μ,方差为,样本大小为n,当n足够大时(一般要求n>=30),那么样本均值的分布近似服从均值为μ,方差为的正态分布。
① 中心极限定理对于总体服从什么分布没有要求;
② 样本均值的期望值与总体的均值相等;
③ 样本均值的方差正比于总体的方差。直观理解:当总体方差较大时,意味着总体的元素分布比较离散,那样本与样本之间差别可能比较大,算出来的均值也不怎么稳定,即样本均值的方差也比较大;
④ 样本均值的方差反比于样本大小n。当样本量越大时,均值必然越稳定,比如我们用10个人(n=10)去估计中国人的平均身高,那每次取一个样本,算出来的均值可能千差万别。如果我们用10万个人(n=100000)去算平均身高,每次采样算出来的结果可能都差不多,即样本均值的方差会很小。
⑤ 中心极限定理是可以证明的
网友评论