1.独立样本的t检验
t.test调用格式1:其中是一个数值型变量,x为二分变量
t.test(y~x, data)
t.test调用格式2:其中有y1,y2为数值型变量。
t.test(y1,y2)
例子:比较美国南方与非南方地区犯罪的监禁概率是否相同。
library(MASS)
t.test(Prob ~ So,data=UScrime)
输出:
Welch Two Sample t-test
data: Prob by So
t = -3.8954, df = 24.925, p-value = 0.0006506
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.03852569 -0.01187439
sample estimates:
mean in group 0 mean in group 1
0.03851265 0.06371269
因此,可以拒绝南方与非南方各州犯罪具有相同监禁概率的假设。
2.非独立样本的t检验
如,年长的男性与年轻的男性失业率概率是否相同,此时,年龄与失业率是有关的,所以是非独立的。
非独立样本的t检验假定组间差异呈正态分布。
调用格式:其中y1,y2为非独立的数值向量
t.test(y1,y2,paired=TRUE)
library(MASS)
with(UScrime, t.test(U1,U2,paired=TRUE))
输出:Paired t-test
data: U1 and U2
t = 32.407, df = 46, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
57.67003 65.30870
sample estimates:
mean of the differences
61.48936
因此,可以拒绝不同年龄男性失业率相同的原假设。
3.卡方独立性检验
卡方检验可以使用chisq.test()函数对二维表的行变量或者列变量进行检验。
library(vcd)
mytable<-xtabs(~Treatment+Improved, data=Arthritis)
mytable
chisq.test(mytable)
输出:
Pearson's Chi-squared test
data: mytable
X-squared = 13.055, df = 2, p-value = 0.001463
因此,治疗与改善效果并不独立。
##############################################################
以下为在真实病例中的应用,检验两种不同的疾病与年龄,性别以及发病部位有无显著差异。
library(vcd)
library(xlsx)
data<-read.xlsx("DiseaseData.xlsx",sheetIndex = 1)
head(data)
性别以及发病部位与两种病的关系用卡方独立检验:
a<-xtabs(~class+sex,data)
b<-xtabs(~class+part,data)
chisq.test(a)
chisq.test(b)
比较年龄(单位:月)与两种病是否有相关性,用t检验
t.test(age~class,data)
网友评论