连续变量的差异比较——T检验
假设我们从总体中抽样,抽样得到的样本均值为,为了判断我们的总体均值是否真的为,我们习惯作差来表示有无差异,但是,仅仅依赖这一简
单差值,我们无法判断差异程度的大小,这个时候我们需要找到某种方式对这一差值进行标准化。标准化的一个基本思路就是将差值除以某种表示离
散程度的指标。
而统计学家发现,假如抽样的总体服从均值为标准差为的正态分布,我们对该总体进行次抽样,每次样本量固定为,得到,这些均值形成的分布,正好服从的正态分布。
,可得;而由于实际工作中,总体的标准差是未知的,所以我们会常常用样本标准差来进行代替,上述表达式就变成了,这个就是我们的。
单样本t检验——样本均数与总体均数的比较
进行单样本t检验,我们需要满足如下的条件:
数据接近正态分布;
数据没有明显的异常值;
变量为连续变量;
观测值相互独立;
通常我们在设计搜集数据阶段就已经解决了后两个假设(ps:你总不可能收集分类变量做单样本t检验,观测值相互独立一般是样本A不会影响样本B的观测值的意思)
实例:R中t.test()命令进行单样本t检验
数据摘要:
异常值检验:
正态性检验:
这里的W检验不拒绝原假设,说明我们的数据服从正态分布
T检验
这里的检验结果表明我们的样本均值和总体均值存在差异
网友评论