独立性检验:
独立性检验是根据频数信息判断两类因子之间彼此相关或相互独立的假设检验。所谓独立性就是指变量之间是独立的,没有关系
检验方法:
- 卡方检验
- Fisher检验
- Cochran-Mantel-Haenszel检验
假设检验:
根据一定的假设条件由样本推断总体的一种方法。
- 原假设:没有发生(比如假设药物对于男女没有作用,如果假设成立则为原假设)
- 备择假设:发生了(假设没有成立则为备择假设)
原假设与备择假设是矛盾的,只能发生一个,到底哪个更容易发生呢就需要根据P值来判断
具体做法:
根据问题的需要对所研究的总体作某种假设记作H0,选取合适的统计量,这个统计量的选取要使得假设H0在成立时其分布为已知,由实测样本计算出统计量的值,并根据根据预先给定的显著性水平进行检验,做出拒绝或接受假设H0的判断。
要根据P值进行判断是否接受原假设H0
P值是一个通过计算得到的概率值,也就是在原假设为真时得到最大的或者超出所得到的检验统计量值的概率
一般将P设为0.05,p<0.05时拒绝原假设H0,反之不拒绝。即P越小越不容易实现原假设(即两者越有联系),P越大越容易实现
卡方检验
> head(Arthritis)#以该数据为例子,对treatment和improved进行独立性检验,如果两者相互独立则说明药物与改善效果没有关系,药物失败反之则药物成功
ID Treatment Sex Age Improved
1 57 Treated Male 27 Some
2 46 Treated Male 29 None
3 77 Treated Male 30 None
4 17 Treated Male 32 Marked
5 36 Treated Male 46 Marked
6 23 Treated Male 58 Marked
> mytable <- table(Arthritis$Treatment,Arthritis$Improved)#首先进行频数的统计
> chisq.test(mytable)#使用chisq.test函数进行卡方检验得到结果
Pearson's Chi-squared test
data: mytable
X-squared = 13.055, df = 2, p-value = 0.001463
# p<0.05说明两者有联系。
Fisher检验
> mytable <- xtabs(~Treatment+Improved,data = Arthritis)
> fisher.test(mytable)#使用fisher.test函数进行检验
Fisher's Exact Test for Count Data
data: mytable
p-value = 0.001393
alternative hypothesis: two.sided
Cochran-Mantel-Haenszel检验(需要三个变量)
> mytable <- xtabs(~Treatment+Improved+Sex,data = Arthritis)#需要三个变量,此时变量的顺序也会影响检测结果
> mytable#显示,该频数统计是以sex为分组,则下面的独立性检验就是检验在sex的水平上treatment与improved是否独立
, , Sex = Female
Improved
Treatment None Some Marked
Placebo 19 7 6
Treated 6 5 16
, , Sex = Male
Improved
Treatment None Some Marked
Placebo 10 0 1
Treated 7 2 5
> mantelhaen.test(mytable)
Cochran-Mantel-Haenszel test
data: mytable
Cochran-Mantel-Haenszel M^2 = 14.632, df = 2, p-value = 0.0006647
#结果显示在sex的水平上,treatment与improved不独立,即有关系
网友评论