以总体均值的假设检验为例讲述如何做出决策。
1. 基于统计量进行决策
① 前面说过很多遍:样本均值服从期望为总体均值,方差为的正态分布。
② 原假设是,总体的均值等于,即
③ 如果总体均值真的真的真的就是,根据①的描述,样本均值的概率分布就是酱婶儿的: ~ ,(σ未知时用s代替),进一步写为: ~ 。
④ 根据事先设定好的显著性水平α,给上述分布划定拒绝域和非拒绝域(最重要一步)
这个图太丑了拒绝域如何划定和使用:
i. 首先根据设定的显著性水平α对称的划定阴影区域(区域面积为α)。如果原假设是正确的,那么采集的样本的均值落到阴影区域的概率是α。通常事先设定的α阈值都是非常小的,比如0.05,0.01等。如果原假设是正确的,样本均值落到阴影区域的概率是非常低的。阴影部分就叫拒绝域。,
ii. 如果我们采集了一个样本,其均值恰好落在了阴影区域,代表着:在原假设正确的前提下,一个概率非常低的事件发生了。这意味着原假设很可能是不对的,所以我们拒绝原假设。这就是为什么阴影区域叫拒绝域。
iii. 原假设是正确的也有α的概率样本均值落在了拒绝域,因此α也代表了“原假设是正确的我们却拒绝了原假设”的概率,即第I类错误概率。
iv. 上述描述以双侧检验为例,单侧检验也是类似的。
基于统计量的进行决策时,只把标准化后的统计量分布划分了拒绝域与非拒绝域,然后根据估计值落在了哪里来决定是拒绝还是不拒绝原假设,而没有进一步考察估计值具体落在了哪里,比如离拒绝域与非拒绝域的界线是近还是远,这相当于丢失了一部分信息。结果是,只给出了犯第I类错误的概率上限,这个上限就是事先确定好的α,而没有给出,犯第I类错误的概率具体是多少。
2. 基于P值进行决策
弄懂了基于统计量进行决策,根据P值进行决策就很简单了。简述如下:
① 与上述相同,基于原假设,样本均值服从分布: ~ ;
② 实际采样计算出来一个样本均值,即一个估计值;
③ 以该值(标准化后)为界,划分拒绝域与非拒绝域(具体划分方式依是双侧检验、右侧检验还是左侧检验而定);
④ 以该值为界划分拒绝域与非拒绝域时,可以反推出对应的显著性水平,记为P,称为“观察到的显著性水平”;
⑤ 若P<α,则拒绝原假设,若P>α,则不拒绝原假设。
基于P值进行决策的好处时,在做出来拒绝原假设的决策后,可以给出犯第I类错误的概率具体为P(而不是上界为α)。
网友评论