- 观测到的数据,可以在一定程度上认为接近总体均值
- 观测多个数据,取样本均值,比观测一个数据更接近总体均值,观测数据越增加,样本均值接近总体均值的可能性越高。
《极简统计学》
对于均值为μ、标准差为σ的一个正态总体的n个样本均值来说,其95%置信区间为下面的不等式解出来的范围,a为样本均值
-1.96 <= (a-μ)/(σ/√n)) <= +1.96
习题1:投掷N枚硬币,正面出现57次,尝试通过计算回答,假设N=100枚要舍弃还是要接受?
根据Tiger给的Tips,假设N=100,正面出现的枚数近似于平均值为50(100/2),S.D为5(sqrt(100)/2)的正态分布,95%预测置信区间为:
-1.96<= (N- 50)/5 <= 1.96
40.2<= N <= 59.8
而N=57在这个区间中,所以可采用。
习题2:随机抽样30个GRE成绩,平均分数为1082分,标准差为108分,决定下列参数的95%和99%置信区间
(1)总体均值
(2)总体标准差
n=30,μ=1082,σ=108
95%的置信区间
-1.96 <= (a-1082)/(108/√30)) <= 1.96
1043.35 ~ 1120.65
99%的置信区间
-2.58 <= (a-1082)/(108/√30)) <= 2.58
1031.13 ~ 1132.87
p.s. 统计学真的是一如既往的枯燥,难怪当年没学下去。现在是偏向虎山行啊,没有退路。
本文为 泰阁志-解密大数据第三次作业,了解更多请关注微信“泰阁志”。
【泰阁志-数据分析】作业4:区间估计
网友评论