分为三种情况:独立大样本、独立小样本、配对样本
1. 独立大样本
独立大样本前提下,两个样本均值之差服从期望值为,方差为的正态分布。
因此,置信水平为1-α的置信区间为 。
当总体的未知时,使用样本方差代替,区间变为
2. 独立小样本
2.1 当总体的方差已知
此时估计公式跟大样本时一毛一样
2.2 当总体的方差未知
2.2.1 当两个总体的方差相等
① 使用两个样本的方差共同估计总体的方差,公式为
② 样本均值之差标准化后服从自由度为的t分布,标准化的方式为 ~
③ 得出的置信水平为1-α的置信区间为
2.2.2 当两个总体的方差不相等
① 样本均值之差标准化后近似服从自由度为v的t分布,v的计算公式为
② 然后的置信水平为1-α的置信区间为
至于为什么,我也不知道~
3. 配对样本
先说下什么叫配对样本。假设我们想估计中国人的平均身高和平均体重的差(两个总体均值之差的估计问题)。一种采样方式是,我们随机找了1W个人采集了他们的身高,得到了身高的一个样本,又随机找了1W个(也可以是2W个)人的体重,得到了体重的一个样本。然后我们就可以研究均值之差了。上面这种采样方式,叫独立样本。
另一种方式,我们随机找了1W个人,采集了他们的身高,又采集了他们的体重。这样得到的身高和体重的样本就叫配对样本。
基于配对样本估计总体均值之差时,可以先在微观上作差,然后基于这些差值构成的集合进行估计。描述如下:
① 先得到由差值构成的集合;
② 计算其均值;
③ 若已知差值的标准差为,则服从正态分布,的置信水平为1-α的置信区间为
④ 若差值的标准差未知,则用样本差值的标准差代替,即
⑤ 上述估计是基于大样本,若是小样本+总体为正态分布的情况,对应的区间为
网友评论