我对统计学的认识还很浅显,正因为如此我知道做为一个普通人需要怎样的类比讲解,才能将高高在上的统计学落入寻常家。
这篇内容并不容易懂,需要有一定的统计学基础才能看懂,未来我会写出活生生的统计学应用栗子。
在假设检验检验中最常见到z值和t值,也可以叫做z统计量和t统计量。那什么时候用z值,什么时候用t值呢?这个问题也困扰了我很久,最近在可汗学院听统计学的课才搞明白原来z值与t值本就是一家。
z值指样本均值距离总体均值有多少个标准偏差,距离越远,P值越小,越有可能拒绝零假设。
z值的计算公式如下
z = (样本均值 - 零假设总体均值)/(总体标准偏差/样本量的平方根)
z值计算公式但总体标准偏差不容易知道,我们能做的就是使用样本标准偏差来推断。
则,s代表样本标准偏差。
当样本量足够大的时候,如n>=30,z值这么计算完全没有问题,之后使用z表查询z值所对应的p值,来推断是否是拒绝零假设。
然而当样本量太小,小到并不足以代表总体水平时结果偏差就会很大。比如说你想评估全校1000名学生的智商,只随机找了10个学生做样本,10个学生能代表1000名学生的整体水平吗?不一定,但手中只有这10名学生的数据该怎么办?此时就可以使用t分布。
多小才算小呢?当样本量<30时,就应该用t表和df(n-1)来查询所对应的p值。
正态分布与t分布
网友评论