参数检验与非参数检验
- 参数检验即检验模型是基于数据符合或具有某种特征,如t.test即要求数据符合正态分布,而非参数检验则不对数据做任何假设。当数据不符合参数检验的假设条件时,需要使用非参数检验来获得可信的结果。
- Tips
- 参数检验中的普遍的一个假设条件是数据符合正态分布,但是根据中心极限定理(central limit theorem, ),但样本数据量足够大时(N > 30),正态分布假设就不再是个问题,我们可以直接使用参数检验,但正态分布检验仍然是推荐的。
一般性假设
- R中参数检验的一般性假设通常包括两个:正态性和方差齐性
- R中有多种方法可以进行数据的正态性检验,比如QQplot和shapiro.test()
- shapiro.test(),H0为数据和正太分布一致,所以当P值小于给定阈值时,可以认为数据不符合正态分布
- 但是当数据量较小时,建议使用Q-Q plot直接观察数据偏离正态分布数据的程度。
- R中方差齐性检验,参考方差的比较。
- R中有多种方法可以进行数据的正态性检验,比如QQplot和shapiro.test()
假设检验
- 两组样本均值的比较
- t.test
- Wilcoxon rank sum test
- 多组样本均值的比较
- ANOVA test (analysis of variance, parametric): extension of t-test to compare more than two groups.
- Kruskal-Wallis rank sum test (non-parametric): extension of Wilcoxon rank test to compare more than two groups
- 方差比较
- Comparing the variances of two groups: F-test (parametric)
- Comparison of the variances of more than two groups: Bartlett’s test (parametric), Levene’s test (parametric) and Fligner-Killeen test (non-parametric)
均值的比较
两组样本
多组样本
one way anova (analysis of variance)
- 即单因素方差分析,多组样本的分组时单个因素分组的,如实验中的control, treat1, treat2
- 假设条件
- The observations are obtained independently and randomly from the population defined by the factor levels. 即独立抽样。
- The data of each factor level are normally distributed. 即正态性
- These normal populations have a common variance. 即方差齐性
- 假设:
- H0 : 多组均值相等;
- H1 : 至少一组均值不等;
网友评论