美文网首页
2021-09-24 关于超几何检验的一些理解

2021-09-24 关于超几何检验的一些理解

作者: hcode | 来源:发表于2021-09-25 00:24 被阅读0次

生物信息里面常见的就是KEGG GO 等通路富集时候用到的 超几何检验知识,为了便于理解 这里举个例子:

目前有200个基因具有GO注释,其中60个是GO04

我们得到20个差异基因,其中有11个是GO04,想问GO04这个通路是否在这20个基因中得到了富集??

(即公式中的,N=200,n=20,M=60,i=11);

我们先算抽取从200个基因里面抽20个基因,其中有11个基因具有GO04的概率:

即0.0093

下面为p值的计算公式:即 p-value=1-(p0+p1+p3+...+p10),可以看到如果括号里面的值越大,说明从200个基因里面抽20个,从抽到0个到抽10个基因是GO04通路里面的基因的概率很大,1-累加值就很小,说明我们的结果显著富集(越不可能发生的事情,我们却发生了)。

拓展R语言计算p值:

phyper(11-1,60,140,20,lower.tail = F)=0.0125还是蛮显著的。

如果还不好理解,你可以试试极端的例子,

总共有10个基因,其中5个基因是GO04,我们现在得到5个差异基因,刚好这5个基因都是GO04(不言而喻这绝对很显著了,p值理论上会趋近于0)

1-(p0+p1+p2+p3+p4) = 1-(1/252+25/252+100/252+100/252+25/252)=1/252=0.003968254很显著!

R语言实现:

phyper(5-1,5,5,5,log.p = F,lower.tail=F)

相关文章

  • 2021-09-24 关于超几何检验的一些理解

    生物信息里面常见的就是KEGGGO等通路富集时候用到的超几何检验知识,为了便于理解这里举个例子: 目前有200个基...

  • Fisher 精确检验

    Fisher精确检验是基于超几何分布计算的,它分为两种,分别是单边检验(等同于超几何检验)和双边检验。 应用于将对...

  • Fisher 精确检验与卡方检验(10X单细胞和10X空间转录组

    Fisher精确检验是基于超几何分布计算的,它分为两种,分别是单边检验(等同于超几何检验)和双边检验。 应用于将对...

  • 生信数据挖掘——富集分析

    什么是富集分析? 粗糙的理解:知道这个基因在什么通路中,执行什么样的功能。 根据差异基因做富集分析 采用超几何检验...

  • 富集分析方法比较

    1. 超几何检验GO、KEGG基因富集分析 这是相对简单粗暴一些的基因富集分析方法,不需要输入基因的表达值,只需要...

  • 18高通量测序-Fisher精确检验和超几何分布

    Fisher精确检验和超几何分布 Fisher精确检验 ​ 我想和我的朋友们分享一些M豆,所以我只拿了...

  • 写超几何分布检验

    library(org.Hs.eg.db) library(KEGG.db) tmp=toTable(org.Hs...

  • 2020-09-20

    Geometry,几何怎样去理解呢? 小的时候,几何就是一些线段啦,三角形平行四边形啦,圆啦的一些关系:已知一些条...

  • Perl 超几何分布计算

    1. 超几何分布公式 超几何分布检验在生信中使用是比较多的,典型的就是 GO 和 KEGG Pathway 的富...

  • 关于几何

    自从开始跟娃娃一起上丁博的数学课,我对星期五居然有了点期待。 鉴于上次因为迟到导致直接跟不上博士节...

网友评论

      本文标题:2021-09-24 关于超几何检验的一些理解

      本文链接:https://www.haomeiwen.com/subject/soptnltx.html