t检验的基本思想----t检验

作者: 统计小菜鸟 | 来源:发表于2020-06-26 15:17 被阅读0次

t检验的基本思想----t检验
t检验-单样本t检验
如何选择T检验？
【简单生活简单记】1.24小记
《白话统计》读书笔记-t and anovar
t检验的基本思想----t分布
python数据分析之t检验
3、Stata入门---常见的统计操作
R语言-T检验、秩和检验、百分比检验、卡方检验
R做方差齐次检验

之前我们介绍了t检验的基本思想-t分布，知道了t分布的含义，那接下来我们就要知道t检验是干嘛的，使用t检验的前提条件是什么。

一、t检验是干嘛的？

t检验是用于比较两个样本均值差异的检验方法，它是用t分布理论推断差异发生的概率，从而判定两个平均数的差异是否显著。

举个栗子，假如我是一个工厂的老板，工厂到了一批新机器，用于生产之前的产品，此时我想知道新机器生产的产品质量是否超过原先的老机器，如果质量差不多，那我就买亏了；质量高才正常，如果质量还不如原先的，那我就是被骗了，血亏。

此时，在生产之前，我先生产一小部分，看看这小部分质量如何，如果好那就可以大范围生产，不然如果我对质量不满意，我得赶紧退货，不然损失太大。现在，摆在我面前有两种方法：

1、将这一小部分的产品质量加起来，求平均值，再和之前的产品质量的均值比较，质量好不好一目了然。

2、采用t检验，通过统计学计算，得出质量是否合格。

第一种方法看着没问题，但懂点统计学基础的人肯定知道这是不可以的，因为你选择的是目前生产的一部分，难道之后生产的完全和这一部分是一样的么？机器不会出一点问题？员工操作也不会出一点问题？

这就引入了抽样误差这一概念

我们为了避免因为质量不理想而大规模生产造成损失，只选择一部分进行测量，这就已经是抽样了，既然是抽样，那就避不开抽样误差。如果选30个产品进行检测，我生产10次，每次30个，检测的话，每次30个产品的质量平均数肯定都不一样，有超过原先的，也有差不多的，甚至有低于原先的。

既然有批次产品质量会有问题，那我怎么能避免呢？我如果运气差，恰好就抽到那批质量不好的作为检测标准，本来有可能是小概率事件，机器没问题，但却误导了我，把新机器退了，那样我将会支付大量的违约金。

t检验的产生应运而生，t检验正好就可以解决这样的问题。

如果我生产成千上万的产品，最后再看产品的质量，如果达标那就通过，继续生产赚钱；如果不达标则不通过，运气好点和之前的质量一样可以继续使用，如果低于原先的质量，我将血亏，就算退货，我也得承担此次生产的成本。既然我们没法通过大量产品得到结果，那就通过小样本来推断总体是否达标，只要统计学上过关，那之后发生错误的风险就会很低。

不可能没有风险，因为这个结论仅仅是统计学上下的结论，是一种概率性的结论，即使出错的概率很低，但不代表不出错。

二、t检验原理

想要了解t检验原理，首先要了解什么是假设检验。此处我先简单说一下，之后会专门出一篇介绍假设检验的原理。

假设检验是一种根据样本数据来推断总体分布或者均值、方差等总体统计参数的方法。

之所以要用样本来估计总体，是因为总体数据很难全部得到，或者说成本太大，比如全国中学生的身高。

假设检验最基本思想：小概率事件不会发生，如某件事发生的概率小于5%，这事不可能发生了，因为在统计学上默认＜5%=不可能。

此时我们来讲t检验的原理

1、建立假设

（1）原假设或无效假设：H0: μ=μ0，即两总体均数相同。（新机器产品质量=旧机器产品质量）

（2）备择假设或有统计学意义假设：H1：μ≠μ0，即两总体均数不同。（新机器产品质量≠旧机器产品质量，是高是低我不知道），根据专业知识及数据特征，备择假设H1也有单侧形式：μ<μ0，μ>μ0。

◆ 选择双侧检验，还是单侧检验需依据数据特征和专业知识进行确定；

◆ 原假设不是随意而为，一般套路是朝着预期目标相反的方向做假设，例如，预期两均值差异明显，那么原假设就是两均值相同（无差异）；

◆ 原假设两总体均值相同，这件事发生的概率P如果小于5%，那么是很罕见的，可以认为是偶然发生的，在统计学上认为这种小概率事件是不可能发生的。

2、计算T统计量及概率P值

在总体方差未知情况下，进行两均数的比较用t检验，在原假设的基础上，按照固定的公式计算T统计量。

◆ t检验中的t统计量一定是服从t分布；

◆ t统计量的计算公式（前为单样本t检验，后为独立样本t检验）

◆P值是用来拒绝原假设H0的概率，与显著性水平进行比较；

3、推断决策（两个假设二选一）

根据计算的T检验统计量，确定相伴概率P值，如果P落入拒绝域，即P<0.05那么就可认为前面做出的【原假设】这件事是不可能发生的，从而备择假设才是正确的。

◆ t检验结果解读的一般套路：P<0.05，则说明两组样本所代表的总体均值差异显著；（我的新机器产品质量和旧机器产品质量不一样，此时再看如果这30个新机器的产品质量的平均值是＞旧机器产品质量平均值的，那就可以下我的新机器产品质量＞旧机器产品质量这一结论；如果这30个产品质量＜旧机器，那就赶紧退货，并完全可以因为虚假宣传要求赔偿。）

◆ 当P＞0.05时，原假设的事件不是小概率事件，没有理由拒绝原假设，即两个均值一致，没有差异。（此时，我买的新机器和旧机器差别不大，赶紧退货止损）

三、双侧or单侧？

双侧T检验：◆ 用户仅知道预期目标是两组样本均值理论上有差异，但不知道是小于还是大于；

◆ 原假设：μ1=μ2，备择假设：μ1≠μ2（用的是不等于号）

单侧T检验：

◆ 用户知道事情发生的方向，如苗木高度超过1.6米即可出圃，即用户知道预期目标有差异，而且是>1.6米；

◆ 原假设：μ1=μ2，备择假设：μ1>μ2或者：μ1<μ2（小于或者大于·号）

再次强调假设不是用户随意指定的，t检验假设套路是：备择假设是你预期希望发生的方向，而原假设则是朝着与预期要发生的相反的方向假设。比如A和B两种治疗方法疗效是否有差异，我们预期目标是二者差异显著，那么备择假设即“有差异”，原假设即“无差异”。

利用SPSS软件进行t检验，软件默认输出的是双侧概率p值，因此如果我们的研究是单侧问题，那么请对该p除以2作为单侧t检验的概率值。

四、t检验的适用条件

t检验最基本的条件是样本数据来自正态分布总体，或近似正态分布总体，简单理解就是样本数据必须具备正态性，符合正态分布。

两组独立样本数据间的方差相等或一致，统计学上称之为“方差齐次”。

具体每一个t检验所要求的适用条件稍微有点区别，我会在具体的篇章中单独介绍，此处不赘述。

本篇介绍完毕，接下来我会逐个介绍每一个t检验的具体用法和使用场景，拜拜。

网友评论

本文标题：t检验的基本思想----t检验

本文链接：https://www.haomeiwen.com/subject/ntkufktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

t检验的基本思想----t检验

相关文章