实例课题:假如你是一名医生,现在你手中有一项课题,课题的内容是调查某山区中的健康成年男子的脉搏均数(次/分钟)与全国健康成年男子的平均水平是否有差异?
你会如何开展这项课题呢?
经过简单思考,我琢磨着我应该这么干!
最初设想的计划:
Step 1: 通过查阅过去的文献,我得知了全国健康成年男子的脉搏均数为72次/分钟。
Step 2: 带上我的小伙伴直奔该山区,俺打算拼上这条老命也要把这个山区中所有健康成年男人的脉搏数据get到!!!
Step 3: 如果上一步成功,咱直接对该山区中得到的所有健康成年男人的脉搏数据求个均值,再与全国的平均水平做个比较,有木有差异岂不是一目了然!
然而,问题1出现了···
在Step2进行的过程中,我悲哀的发现这个山区中的成年健康男子总人数至少在一万人以上,且大部分都外出务工,剩下的很多人也不太愿意配合我们的调查,经过一番艰辛的随机抽查,我才仅仅得到了25个人的数据,时间已经来不及了,我们无法直接得到总体的所有待测数据。没办法了,现在只能用这样本容量为25的单个小样本代表总体(山区中所有健康男人的脉搏均数)进行推断了。
问题1:在实际情况中,我们往往难以直接得到总体的所有待测数据。
答案1:抽样——利用样本表示总体 。
通过计算这25个人组成的小样本,我们得到其脉搏均数为74.7次/分,标准差为6.5次/分。
紧接着,问题2出现了···
我们很容易想到,抽样是存在误差的,换句话说,即使未知总体1(山区中所有健康成年男人的脉搏数)的均值等于已知的总体2(全国健康成年男子的脉搏数)的均值72,从总体1中抽出的样本的均值也极有可能不等于72,果然在这次试验中,样本的均值为74.7。那么,通过比较随机抽取的样本均值74.7与已知的总体2均值72的差异,到底能否判断出该样本来自的未知总体1的均值与已知的总体2的均值有无差别呢(这才是我们的最初目的)? 即,这种差异可能是由以下两种原因造成的。
- 原因一:总体1与总体2的均值无差别,都等于72。样本与总体2的差异是由抽样误差引起的。
- 原因二:总体1与总体2的均值有差别,总体1的均值不等于72。虽然存在着一定的误差,但样本均值与总体2均值的差异主要是由于总体1与总体2的差异造成的 。
问题2:抽样存在误差,怎样判断样本统计量与总体参数(!!!不是被抽样的总体,此例中为总体 2)的差异是由抽样误差引起的还是本质差别造成的?
答案2:利用带有某种概率性质的反证法作为统计推断方法,即统计假设检验!!!
想必大家对数学上的反证法都不陌生,想要继续解决上面的问题,我们也必须用到带有某种概率性质的反证思想。
提出检验假设 :假设某山区成年男子的脉搏均数与全国成年男子的相等。即总体1均值=总体2均值。
备择假设 :总体1均值总体2均值,总体1与总体2的均值有差别。
现在我们假设 成立,即肯定了原因一,总体1与总体2的均值无差别,认为是抽样误差导致了样本均值与总体均值的差异。按照反证法的思想,我们必须经过推理导出“矛盾”。
问题三出现···
“矛盾”在哪呢?
想要找到这种矛盾,我们必须先理解统计学中的小概率原理。统计学上,把小概率事件在一次实验中看成是实际不可能发生的事件,一般认为小于等于0.05或0.01的概率为小概率。 简而言之:小概率事件在一次试验中不可能发生。
因此,小概率事件的发生就是一种带有概率性质的矛盾!!! 如果我们能证明在该实验中通过一次抽取得到样本均值为74.2的事件是一起小概率事件,那么我们就可得出结论: 拒绝检验假设,接受备择假设:即总体1均值总体2均值,总体1与总体2的均值有差别,该山区中的健康成年男子的脉搏均数与全国健康成年男子的脉搏均数在统计学上具有显著差异。反之,如果得到均值为74.7的事件不是小概率事件,我们就可接受检验假设,认为该山区中的健康成年男子的脉搏均数与全国健康成年男子的脉搏均数在统计学上差异不显著。
问题3:怎样对原假设和备择假设做出决策,或如何找到当假设成立时的矛盾?
答案3:利用小概率原理,小概率事件的发生就是一种带有概率性质的矛盾!!!
因此,我们需要判断样本均值的取值为74.7这起事件是否为一起小概率事件(此处需要理解“样本均值的取值为74.7这起事件”的意义。即是说,在总体1的均值为72时,我们在总体中任取一个由25个个体组成的样本并求其均值,这个均值的大小有很多可能,取70、71、72、73···都是可能的,而在此例中取到均值为74.7被看作一起事件)。
问题4上线···
怎样判断样本均值为74.7是否为一起小概率事件?得益于Gosset(大名鼎鼎的学生student)非凡的贡献,我们现在知道:当总体呈正态分布,如果总体标准差未知,而且样本容量n<30,此时一切可能的样本平均数与总体平均数的离差统计量呈 t 分布。在满足上述条件的情况下,检验一个小样本平均数与一已知的总体平均数的差异是否显著的过程被称为:单样本 t 检验,其检验统计量为:
其中, 为样本平均数 ,为总体平均,为样本标准差,为样本容量。现已知 =25,=74.7次/分,=6.5次/分,=72次/分。按公式计算得:=2.07。根据 t 分布的概率密度函数,P(|t|>2.07) = 0.048 < 0.05。所以拒绝检验假设 ,接受 ,得出结论—该山区中的健康成年男子的脉搏均数与全国健康成年男子的脉搏均数在统计学上具有显著差别。
问题4:如何判断是否为小概率事件?
答案4:利用检验统计量及其在零假设()情况下所服从的概率分布模型来判断。
以上过程只是对假设检验的简单初步理解,实际上,从Fisher首先开创假设检验及Neyman-Pearson对假设检验所进行的进一步发展完善以来。对于使用假设检验、P值和统计显著性的争论就从未停歇过。在使用假设检验的相关工具时,我们应结合实际情况,谨慎的得出试验结论!!!
网友评论