差异基因的方法 p-value

作者: wangchuang2017 | 来源:发表于2018-11-14 21:33 被阅读4次

差异基因的方法 p-value
差异基因筛选方法：基于基因表达秩序关系识别稳定逆转基因对（代码版
筛选差异基因，倍数法，t检验，SAM
差异基因很多时该怎么办
浅谈p值（p-value是什么）
p-值
p-value&q-value&FDR
热图绘制
差异基因检测方法
Statquest 学习笔记——P-value

上周，我们分享了用RPKM值计算差异基因的方法，这周我们继续分享另外一种方法p-value。

我们都知道，在利用RNA-seq数据比较分析两个样品中同一个基因是否存在差异表达的时候，一般选取两个标准：

1）FoldChange

FoldChange，很容易理解了。就是两样品中同一个基因表达水平的变化倍数。可以用RPKM值来计算，关于RPKM的计算方法，之前有个帖子已经分享了，大家可以戳这里查看。

2）FDR校正后的p-value，即q-value

FDR值的计算方法又可分为以下2种：

1.对每个基因进行p-value的计算

假设观测到基因A对应的reads数为x，已知在一个大文库中，每个基因的表达量只占所有基因表达量的一小部分，在这种情况下，p(x)的分布服从泊松分布。已知样本一中唯一比对到基因组的总reads数为N1，样本二中唯一比对到基因组的总reads数为N2，样本一中唯一比对到基因A的总reads数为x，样本二中唯一比对到基因A的总reads数为y，则基因A在两样本中表达量相等的概率可由以下公式计算：

image

2.用FDR错误控制法对p-value作多重假设检验校正

FDR错误控制法是Benjamini于1995年提出一种方法,通过控制FDR(False Discovery Rate)来决定P值的域值. 假设你挑选了R个差异表达的基因，其中有S个是真正有差异表达的，另外有V个其实是没有差异表达的，是假阳性的。实践中希望错误比例Q＝V/R平均而言不能超过某个预先设定的值（比如0.05），在统计学上，这也就等价于控制FDR不能超过5％.

对所有候选基因的p值进行从小到大排序，则若想控制fdr不能超过q，则只需找到最大的正整数i，使得 p(i)<= (i*q)/m。

然后，挑选对应p(1),p(2),...,p(i)的基因做为差异表达基因，这样就能从统计学上保证fdr不超过q。因此，FDR的计算公式如下：

image

如果你的数据用以上2种方法分析都差异不显著，又或者差异基因太多，那也真是心塞呢。不过基迪奥的技术们还是有分析办法的。戳下面题目查看~

差异基因的方法 p-value
上周，我们分享了用RPKM值计算差异基因的方法，这周我们继续分享另外一种方法p-value。我们都知道，在利用R...
差异基因筛选方法：基于基因表达秩序关系识别稳定逆转基因对（代码版
2022.3.20 初版2022.3.28 加入代码众所周知，差异基因的分析方法有很多种：①普通的差异基因计算方法...
筛选差异基因，倍数法，t检验，SAM
一、实验内容利用SAM筛选差异基因比较筛选差异基因的方法：倍数法，t检验，SAM二、实验目的掌握筛选差异...
差异基因很多时该怎么办
| 之前跟大家分享过“差异基因不显著的应对方法“；但同时，也有很多朋友表示他的项目差异基因不仅显著，并且还很多多多...
浅谈p值（p-value是什么）
当我们说到p-value时，我们在说什么？ “这个变量的p-value小于0.05，所以这个变量很重要” .......
p-值
A P-value measures the strength of evidence in support of...
p-value&q-value&FDR
P-value 的计算方式 1) P-value 是 (在H0 = true的情况下)得到和试验数据一样极端(或更...
热图绘制
从全部差异基因筛选出一定阈值（FC，P值）筛选以后得到差异基因，再从所有差异基因的表达矩阵中筛选出最终差异基因的表...
差异基因检测方法
差异基因的检测方法很多，但生物学家偏好使用的是fold change（FC）和t-test。猜测因为一是它们比较简...
Statquest 学习笔记——P-value
1. 为什么要使用P-value 在统计学中为什么要使用P-value值，statquest用一个非常简单的例子来...