R语言组间差异的非参数检验

作者: 肖玉贤 | 来源:发表于2018-05-15 15:28 被阅读0次

R语言组间差异的非参数检验
计算微生物otu表格组间差异
R语言：DESeq计算组间Fold Change
R语言|绘制组间差异柱状图
R绘图_几种多重比较方法
两组间差异的非参数检验
R语言之生信⑦Cox比例风险模型(单因素)
R语言之生信⑧Cox比例风险模型(多因素)
R语言之生信（9）R语言多个生存分析曲线比较
R语言之生信（10）多个探针对应一个基因的处理方法

若两组数据独立，可以使用wilcoxon秩和检验（mann-whitney U检验）,来评估观测是否是从相同的概率分布中抽取的（即，在一个总体中获得更高得分的概率是否比另一个总体要大）

wilcox.test(y~x, data),其中，y是一个数值型变量，x是一个二分变量。

> with(UScrime, by(Prob, So, median))

So: 0

[1] 0.038201

----------------------------------------------------------------------

So: 1

[1] 0.055552

> wilcox.test(Prob ~ So, data=UScrime)

Wilcoxon rank sum test

data: Prob by So

W = 81, p-value = 8.488e-05

alternative hypothesis: true location shift is not equal to 0

> sapply(UScrime[c("U1","U2")],median)

U1 U2

92 34

> with(UScrime, wilcox.test(U1,U2,paried=TRUE))

Wilcoxon rank sum test with continuity correction

data: U1 and U2

W = 2209, p-value < 2.2e-16

alternative hypothesis: true location shift is not equal to 0

Warning message:

In wilcox.test.default(U1, U2, paried = TRUE) :

cannot compute exact p-value with ties

> states <- data.frame(state.region, state.x77)

> kruskal.test(Illiteracy~state.region, data=states)

Kruskal-Wallis rank sum test

data: Illiteracy by state.region

Kruskal-Wallis chi-squared = 22.672, df = 3, p-value = 4.726e-05

> #显然，结果表明，美国各个地区的文盲率是各不相同的（p<0.001）

> source("http://www.statmethods.net/RiA/wmc.txt")

> states<- data.frame(state.region, state.x77)

> wmc(Illiteracy ~ state.region, data=states, method="holm")

Descriptive Statistics

West North Central Northeast South

n 13.00000 12.00000 9.00000 16.00000

median 0.60000 0.70000 1.10000 1.75000

mad 0.14826 0.14826 0.29652 0.59304

Multiple Comparisons (Wilcoxon Rank Sum Tests)

Probability Adjustment = holm

Group.1 Group.2 W p

1 West North Central 88.0 8.665618e-01

2 West Northeast 46.5 8.665618e-01

3 West South 39.0 1.788186e-02 *

4 North Central Northeast 20.5 5.359707e-02 .

5 North Central South 2.0 8.051509e-05 ***

6 Northeast South 18.0 1.187644e-02 *

---

Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

>#source（）函数下载并执行了定义wmc()函数的R脚本。函数的形式wmc(y~A, data, method)，其中，y是数值输出变量，A是分组变量， data是包含这些变量的数据框，method指定限制I类误差的方法。代码清单7.17使用的是基于holm提出的调整方法，可以很大程度上控制总体I类误差率。

wmc()函数首先给出了样本量、样本中位数、每组的绝对中位数，其中，西部地区文盲率最低，南部地区文盲率最高。然后，函数生成了六组统计比较。可以从双侧P看到，南部与其他三个区域有明显差别，但当显著性水平p<0.05时，其他三个区域间并没有统计显著的差别。

组间差异的非参数检验的基本知识到这就结束了，咱们下期再见！O(∩_∩)O哈哈~

网友评论

本文标题：R语言组间差异的非参数检验

本文链接：https://www.haomeiwen.com/subject/jxpedftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

R语言组间差异的非参数检验

相关文章