- t检验属于参数检验,参数检验需要假设总体的分布
- 非参数检验并不依赖于总体的分布
- 单样本t检验和成对样本的t检验对应于威尔科克森符号秩检验,下简称符号秩检验;独立样本的t检验对应于曼-惠特尼U检验,下面简称秩和检验。
1. 秩和检验
- 秩和检验用 U 统计量(下面会有解释)来检验原假设:两个样本(比如两个班级同学的身高)来自同一分布。假设一班有 n1 个同学,二班有 n2 个同学,两两比较共有 n1n2 种组合, U 统计量表示一班获胜的次数。
- 不难发现,当一班所有人都比二班的任何人高时,U 取最大值 n1n2;当一班所有人都比二班矮时,U 取最小值 0。如果原假设成立,即两个班级同学身高分布相同,那么随机从每个班中抽取一个同学进行身高 PK,一班获胜的概率应该接近二班获胜的概率,这时 U 统计量应该接近
2. 与t检验对比
2.1. 非参数检验的优势
- 秩和检验不要求数据正态;
- 秩和检验适用于代表等级的定序变量;
- 秩和检验的结果不容易受到极端值的影响,因此比 t 检验更稳健。
2.2. 非参数检验的劣势
- 如果数据确实来自正态分布的总体,如果用了秩和检验而不是t检验,会降低统计功效,即实际上有显著差异的两组数据更容易被误判为没有差异。
- t检验是直接检验两组数据的均值是否相等,秩和检验是检验一组数据大于另外一组数据的概率是不是大于0.5。所以秩和检验得出的结论更模糊。
网友评论