今天我们回到SPSS中来看一下如何利用SPSS进行单样本T检验。
一般情况下,统计学中的理论都是基于大量的样本而来的。到这里大家可能会问,多少的样本量算大呢?其实对于定义样本量大小来说,没有一个统一的标准,主要还是取决于在实际的分析场景中所使用的模型的要求和数据的具体分布状况。
单样本T检验主要是用来检验某个变量的总体均值和某个指定值之间是否存在显著性差异。如果是大样本的单样本检验,一般在统计学中会被称为U检验,它主要是采用服从正态分布的U统计量作为检验统计量;如果是小样本并且样本服从正态分布,就采用t统计量进行单样本T检验。如果都不满足的话,就采用非参数检验,比如秩和检验等。但是对于T检验来说,它的稳健性比较好,这个特性的意义就是如果样本分布偏离正态分布不是特别严重的话,也是可以采用T检验进行分析的。
在统计学中,根据概率论的中心极限定理,在大样本的情况下,T分布和正态分布的密度函数是十分接近的。在实际的分析操作中,其实不管是大样本还是小样本,都是可以用T检验来进行单样本均值检验的。在大样本的情况下,就算是样本分布是偏离正态的情况,也仍然是可以用T检验进行分析的,这被称为T检验的稳健性。因此,在大样本情况下,T检验和U检验是一致的。
说了这么多,我们先来看一下今天所要进行分析的数据:
图中的数据是某个厂房中两台机器所生产的部分模具直径测量结果,第一列数据是对应的机器编号,由于标准模具的直径应该为25,所以我们通过单样本T检验来对数据进行分析,看这两台机器所生产的模具是否符合要求,是否有必要进行维修。
在这次的分析中,因为我们需要对两台机器分别进行检验,所以我们需要根据机器拆分数据,操作步骤如下:
当我们按照上面的方法设置完了以后,我们会发现在拆分文件的文件框中左下角的当前状态已经变成了:‘比较:机器编号’。这就说明我们的数据拆分步骤已经完成了。接下来就可以进行单样本T检验了:
我们按照上面的方法进行单样本T检验的设置,在检验值的数值框中输入我们的标准直径25,点击确定就可以得到本次单样本T检验的分析结果:
上图就是本次单样本T检验的分析结果,第一个表是两个机器所生产的模具对应的直径均值、标准差及均值的标准误三个统计量。从结果来看,两台机器所生产的模具都或多或少的偏离了标准值25。但是从这个表里,我们无法知道两台机器其中是否有生产了不合格的模具,因为我们没有统计检验。
从第二个表中我们可以看到,这就是单样本T检验的检验结果,其中t列就是统计量的值,df为自由度,Sig为P值,均值差值就是分别两台机器的均值减去25的差值。在这个检验结果中,如果P值小于0.05,就说明其通过了显著性检验。在本次的分析中,两个P值分别为0.327和0.084,均大于0.05,也就是说明两台机器生产的模具直径是满足要求的。如果其中一个P值小于0.05,就说明对应的机器所生产的模具是不符合要求的,同时根据前面的t列来看对应的机器所生产的模具直径是小于标准还是大于标准。
欢迎大家进行补充,大家可以在我们的QQ交流群(243949148)或者微信群中(关注小白数据营公众号后台进入)参与讨论和交流。
网友评论