参考书 《白话统计学》
t分布
在正态分布中,获得精确概率,需要满足两个条件:
- 总体标准差已知
- 大样本 n > 120
在不满足以上条件的时候,我们必须调整概率估计,把样本容量考虑在内,t分布可以实现这一目的
独立样本t检验
独立样本t检验是最常用的t检验方法之一,比较两个独立样本在一个给定变量上的均值,就可以使用这种检验,例如:
比较随机选择的50名男性和50名女性的平均身高
就可以使用独立样本t检验。
需要注意的是,这种检验两个样本要独立,比如男性样本和女性样本之间无关,且两样本没有重叠,即一个对象不能同时属于两个群组,因此这些群组是独立的,适用于独立样本t检验。
独立样本t检验需要一个分类或者说名义自变量,以及一个连续或等距尺度的因变量
因变量是取值因为自变量值不同而不同的变量,自变量是引起或者仅仅用来预测因变量取值的变量。
t检验的自变量是一个或只有两个类别的变量(男性和女性)。
在这类t检验中,我们想知道的是一变量的平均取值是否因为其属于不同群组而不同,比如之前的例子就相当于
人的平均身高(因变量)是否取决于性别(自变量)
独立样本t检验的概念问题
检测所用到的标准误
t检验的目的就是:两个独立样本在某一变量上平均取值是否有显著差异,也就是说,关心的不只是这两个样本在某一变量上是否不同, 而是这两个样本之间均值的差异是否足够大。
那这些均值之间的标准误是多少
t值计算公式独立样本均值之差的标准误
样本容量大致相等
image两个样本容量大致相等,那就是用上式
样本容量不是大致相等
考虑曼一惠特尼U检验
独立样本t检验的显著性
t分布要考虑样本容量,其形状随着样本容量变化而变化,所以要考虑自由度
image
自由度越小,检验就越保守
独立样本t检验的效应量
image配对或相依样本t检验
用于比较单一因变量的两个均值,与独立样本检验不同,相依样本t检验用于比较单个样本的不同均值,或者比较两个匹配或者配对样本的均值 例如
一组同学上个月参加了一场考试,这个月又参加了同样的考试
可以使用相依样本t检验比较两次考试的平均分
又或者
比较一组男生的学术能力与其父亲的学术能力
在这个例子中,每个男生都会和其父亲配对,这种配对,叫做取值相互依存,可以使用相依样本t检验.
相依样本t检验和独立样本t检验的区别在于,后者比较的是两个独立样本在一个变量上的取值, 前者比较的是单个样本在两个变量上的取值
以工人休假之前和之后的生产效率举例
image image
网友评论