上一次我们说到了如何对样本进行单样本T检验,知道了如何通过单样本T检验来对数据进行分析。今天我们继续来看看T检验中的另一位成员—独立样本T检验。
在进行数据分析的时候,如果我们的样本量中有两个或者两个以上的样本时,我们可能会需要去考虑这些样本整体在统计学上是否存在显著性差异。一般来说,我们在利用两个不同样本的均值来了解它们之间的区别时,就是两个样本的检验。如果样本更多的话,我们可以利用方差分析来进行检验,也就是说,其实方差分析是T检验的一种推广。
在实际的分析操作中,不管是大样本还是小样本,只要能够满足T检验的条件,就都可以利用T检验方法来对样本进行分析。而根据两个样本之间的关系,又分为独立样本T检验和配对样本T检验两种,今天我们说的就是其中的一种—独立样本T检验。这两种T检验的不同就是配对样本T检验是用来比较同一个样本的两次不同测量结果。说到这里,就不得不提到使用独立样本T检验和配对样本T检验的条件了:
1.两个样本相互独立;
2.两个样本应服从正态分布。【上一篇文章跟大家说过T检验的稳健性,不知道大家还有没有印象,也就是说如果大样本的情况下,有的时候两个样本虽然不满足正态分布的条件,但是两者之间的分布形状是相似的,这个时候两个样本量相差不大但是样本量大,是仍然可以使用T检验的】;
3.方差齐,也就是两个样本的方差是相同的。
我们先来看看今天要分析的数据:
上图就是我们本次用来进行分析的数据,数据内容分别为员工编号、机器类型以及对应机器的产值。主要是想通过数据分析来看新旧机器的产值情况哪种更好,是否应该将旧机器全部更新,或者继续使用旧机器。本文就将通过独立样本T检验来进行分析,帮助企业做出决策。
我们首先需要对数据进行描述统计分析,检查数据是否服从正态分布。检验过程为【分析】——【描述统计】——【探索】:
need-to-insert-img
我们按照上图的方式对界面进行设置,将产值选入因变量列表中,机器类别选入因子列表中。在绘制中勾选带检验的正态图。最后得到我们对正态性检验的结果:
need-to-insert-img
我们主要来看一下正态性检验的结果表,因为样本量较小,所以我们来看S-W检验结果,两种机器的检验P值分别为0.157和0.914,均大于0.05,说明数据服从正态分布(当然我们不能只是来看这一个图,在实际的分析中,我们还可以结合Q-Q图、P-P图来检验,对应的作图方式之前已经给大家分享过,其他条件大家也可以进行对应的检验)。
接下来我们利用独立样本T检验来对数据进行分析:
need-to-insert-img
我们依旧对数据进行设置,按照上图设置完以后就可以得到我们本次检验的结果:
从上面的结果我们可以看出,方差齐性检验的P值为0.054,大于0.05,说明方差是齐的。这时候我们就按第一排假设方差相等来继续看,在后面的P值中,P值为0.305大于0.05,说明两者之间不存在显著性差异(由于本次分析的数据量较小,仅作为一个演示,让大家了解分析过程)。
到这里,我们本次的分析就全部做完了,下一次我们继续来了解如何利用配对样本T检验来进行分析。大家可以先自己尝试一下,动手实操一下,可以有更加深刻的认识。
欢迎大家进行补充,大家可以在我们的QQ交流群(243949148)或者微信群中(关注小白数据营公众号后台进入)参与讨论和交流。
网友评论