t检验的基本思想----t检验

作者: 统计小菜鸟 | 来源:发表于2020-06-26 15:17 被阅读0次

​之前我们介绍了t检验的基本思想-t分布,知道了t分布的含义,那接下来我们就要知道t检验是干嘛的,使用t检验的前提条件是什么。

一、t检验是干嘛的?

t检验是用于比较两个样本均值差异的检验方法,它是用t分布理论推断差异发生的概率,从而判定两个平均数的差异是否显著。

举个栗子,假如我是一个工厂的老板,工厂到了一批新机器,用于生产之前的产品,此时我想知道新机器生产的产品质量是否超过原先的老机器,如果质量差不多,那我就买亏了;质量高才正常,如果质量还不如原先的,那我就是被骗了,血亏。

此时,在生产之前,我先生产一小部分,看看这小部分质量如何,如果好那就可以大范围生产,不然如果我对质量不满意,我得赶紧退货,不然损失太大。现在,摆在我面前有两种方法:

1、将这一小部分的产品质量加起来,求平均值,再和之前的产品质量的均值比较,质量好不好一目了然。

2、采用t检验,通过统计学计算,得出质量是否合格。

第一种方法看着没问题,但懂点统计学基础的人肯定知道这是不可以的,因为你选择的是目前生产的一部分,难道之后生产的完全和这一部分是一样的么?机器不会出一点问题?员工操作也不会出一点问题?

这就引入了抽样误差这一概念

我们为了避免因为质量不理想而大规模生产造成损失,只选择一部分进行测量,这就已经是抽样了,既然是抽样,那就避不开抽样误差。如果选30个产品进行检测,我生产10次,每次30个,检测的话,每次30个产品的质量平均数肯定都不一样,有超过原先的,也有差不多的,甚至有低于原先的。

既然有批次产品质量会有问题,那我怎么能避免呢?我如果运气差,恰好就抽到那批质量不好的作为检测标准,本来有可能是小概率事件,机器没问题,但却误导了我,把新机器退了,那样我将会支付大量的违约金。

t检验的产生应运而生,t检验正好就可以解决这样的问题。

如果我生产成千上万的产品,最后再看产品的质量,如果达标那就通过,继续生产赚钱;如果不达标则不通过,运气好点和之前的质量一样可以继续使用,如果低于原先的质量,我将血亏,就算退货,我也得承担此次生产的成本。既然我们没法通过大量产品得到结果,那就通过小样本来推断总体是否达标,只要统计学上过关,那之后发生错误的风险就会很低。

不可能没有风险,因为这个结论仅仅是统计学上下的结论,是一种概率性的结论,即使出错的概率很低,但不代表不出错。

二、t检验原理

想要了解t检验原理,首先要了解什么是假设检验。此处我先简单说一下,之后会专门出一篇介绍假设检验的原理。

假设检验是一种根据样本数据来推断总体分布或者均值、方差等总体统计参数的方法。

之所以要用样本来估计总体,是因为总体数据很难全部得到,或者说成本太大,比如全国中学生的身高。

假设检验最基本思想:小概率事件不会发生,如某件事发生的概率小于5%,这事不可能发生了,因为在统计学上默认<5%=不可能。

此时我们来讲t检验的原理

1、建立假设 

(1)原假设或无效假设:H0: μ=μ0,即两总体均数相同。 (新机器产品质量=旧机器产品质量)

(2)备择假设或有统计学意义假设:H1:μ≠μ0,即两总体均数不同。(新机器产品质量≠旧机器产品质量,是高是低我不知道),根据专业知识及数据特征,备择假设H1也有单侧形式:μ<μ0,μ>μ0。

◆ 选择双侧检验,还是单侧检验需依据数据特征和专业知识进行确定;

◆ 原假设不是随意而为,一般套路是朝着预期目标相反的方向做假设,例如,预期两均值差异明显,那么原假设就是两均值相同(无差异); 

◆ 原假设两总体均值相同,这件事发生的概率P如果小于5%,那么是很罕见的,可以认为是偶然发生的,在统计学上认为这种小概率事件是不可能发生的。

2、计算T统计量及概率P值 

在总体方差未知情况下,进行两均数的比较用t检验,在原假设的基础上,按照固定的公式计算T统计量。 

◆ t检验中的t统计量一定是服从t分布; 

◆ t统计量的计算公式(前为单样本t检验,后为独立样本t检验) 

◆P值是用来拒绝原假设H0的概率,与显著性水平进行比较;

3、推断决策(两个假设二选一)

根据计算的T检验统计量,确定相伴概率P值,如果P落入拒绝域,即P<0.05那么就可认为前面做出的【原假设】这件事是不可能发生的,从而备择假设才是正确的。

◆ t检验结果解读的一般套路:P<0.05,则说明两组样本所代表的总体均 值差异显著;(我的新机器产品质量和旧机器产品质量不一样,此时再看如果这30个新机器的产品质量的平均值是>旧机器产品质量平均值的,那就可以下我的新机器产品质量>旧机器产品质量这一结论;如果这30个产品质量<旧机器,那就赶紧退货,并完全可以因为虚假宣传要求赔偿。)

◆ 当P>0.05时,原假设的事件不是小概率事件,没有理由拒绝原假设,即两个均值一致,没有差异。(此时,我买的新机器和旧机器差别不大,赶紧退货止损)

三、双侧or单侧?

双侧T检验:◆ 用户仅知道预期目标是两组样本均值理论上有差异,但不知道是小于还是大于; 

◆ 原假设:μ1=μ2,备择假设:μ1≠μ2(用的是不等于号) 

单侧T检验: 

◆ 用户知道事情发生的方向,如苗木高度超过1.6米即可出圃,即用户知道预期目标有差异,而且是>1.6米;

◆ 原假设:μ1=μ2,备择假设:μ1>μ2或者:μ1<μ2(小于或者大于·号) 

再次强调假设不是用户随意指定的,t检验假设套路是:备择假设是你预期希望发生的方向,而原假设则是朝着与预期要发生的相反的方向假设。比如A和B两种治疗方法疗效是否有差异,我们预期目标是二者差异 显著,那么备择假设即“有差异”,原假设即“无差异”。

利用SPSS软件进行t检验,软件默认输出的是双侧概率p值,因此如果我们的研究是单侧问题,那么请对该p除以2作为单侧t检验的概率值。

四、t检验的适用条件

t检验最基本的条件是样本数据来自正态分布总体,或近似正态分布总体,简单理解就是样本数据必须具备正态性,符合正态分布。

两组独立样本数据间的方差相等或一致,统计学上称之为“方差齐次”。

具体每一个t检验所要求的适用条件稍微有点区别,我会在具体的篇章中单独介绍,此处不赘述。

本篇介绍完毕,接下来我会逐个介绍每一个t检验的具体用法和使用场景,拜拜。

相关文章

  • t检验的基本思想----t检验

    ​之前我们介绍了t检验的基本思想-t分布,知道了t分布的含义,那接下来我们就要知道t检验是干嘛的,使用t检验的前提...

  • t检验-单样本t检验

    ​在上一篇我们简单了解了t检验是干吗用的,现在就开始讲解t检验下的单样本t检验。 基本思想: t检验的本质就是看两...

  • 如何选择T检验?

    内容目录 t 检验分类配对 t 检验(非独立t检验)非配对 t 检验(独立t检验)单/双侧 t 检验选择 小结: ...

  • 【简单生活简单记】1.24小记

    ✨学习假设检验的一天。 假设检验: 假设检验基本思想、左右侧检验与双侧检验、Z检验基本原理、Z检验实例、T检验基本...

  • 《白话统计》读书笔记-t and anovar

    t检验t检验的使用条件t检验的实现独立样本t检验配对样本t检验Wilcoxon秩和的实现 方差分析方差分析中变异分...

  • t检验的基本思想----t分布

    在学习t检验之前,大家首先要明白什么是t分布? 历史由来: 18世纪初,正态分布被发现后,大家无不惊异于世界的神奇...

  • python数据分析之t检验

    t检验应用: 1、单样本检验: 2、样本检验 3、对t检验 4、独立样本t检验 5、“配对”或者“重复测量”检验 ...

  • 3、Stata入门---常见的统计操作

    一、T检验【T-test】 t 检验(t test)又称学生t检验(Student t-test)可以说是统计推断...

  • R语言-T检验、秩和检验、百分比检验、卡方检验

    T检验与秩和检验 T检验:符合正态分布的数据用T检验秩和检验:不满足正态分布的数据用秩和检验 正态分布的检验 非正...

  • R做方差齐次检验

    一组数据需要做t检验,了解了一下t检验分为:a.单样本t检验,b.独立双样本t检验和c.成对或非独立样本t检验,三...

网友评论

    本文标题:t检验的基本思想----t检验

    本文链接:https://www.haomeiwen.com/subject/ntkufktx.html